Abschlussarbeit

Evaluation der Effektivität von Einzelwörtern, Chargrams, N-Grams und Satz-Embeddings in der Spam- und Phishing-Erkennung

Betreuer

Thesis: Bachelor-/Masterarbeit

Diese Arbeit vergleicht die Wirksamkeit verschiedener Textrepräsentationstechniken (z. B. Einzelwörter, Chargrams, N-Gramme oder Sentence Embeddings) für die Erkennung von Spam und Phishing. Ziel ist es, die Unterschiede, Schwächen und Stärken jeder Methode zu identifizieren und zu vergleichen.

Voraussetzungen

Erforderlich

  • Grundlegendes Verständnis von künstlicher Intelligenz und maschinellem Lernen (abgeschlossener Kurs Grundlagen der Künstlichen Intelligenz)
  • Kenntnisse in Natural Language Processing Techniken, z.B. Text-Klassifizierung und Techniken für Feature-Extraction
  • Programmierkenntnisse in mindestens einer gängigen Sprache (vorzugsweise Python)

Optional

  • Kurse belegt:
    • Internet-Technologie & Web Engineering
    • Fortgeschrittene Methoden des maschinellen Lernens
    • Sicherheit in Kommunikationsnetzen
  • Kenntnisse über Evaluationsmetriken für KI-Modelle
  • LaTeX-Kenntnisse