Abschlussarbeit
Evaluation der Effektivität von Einzelwörtern, Chargrams, N-Grams und Satz-Embeddings in der Spam- und Phishing-Erkennung
Betreuer
Thesis: Bachelor-/Masterarbeit
Diese Arbeit vergleicht die Wirksamkeit verschiedener Textrepräsentationstechniken (z. B. Einzelwörter, Chargrams, N-Gramme oder Sentence Embeddings) für die Erkennung von Spam und Phishing. Ziel ist es, die Unterschiede, Schwächen und Stärken jeder Methode zu identifizieren und zu vergleichen.
Voraussetzungen
Erforderlich
- Grundlegendes Verständnis von künstlicher Intelligenz und maschinellem Lernen (abgeschlossener Kurs Grundlagen der Künstlichen Intelligenz)
- Kenntnisse in Natural Language Processing Techniken, z.B. Text-Klassifizierung und Techniken für Feature-Extraction
- Programmierkenntnisse in mindestens einer gängigen Sprache (vorzugsweise Python)
Optional
- Kurse belegt:
- Internet-Technologie & Web Engineering
- Fortgeschrittene Methoden des maschinellen Lernens
- Sicherheit in Kommunikationsnetzen
- Kenntnisse über Evaluationsmetriken für KI-Modelle
- LaTeX-Kenntnisse