Abschlussarbeit

Synthetische Erzeugung von Ham-E-Mails zur Verbesserung des Spam-Klassifikationstrainings

Betreuer

Thesis: Masterarbeit

Diese Arbeit untersucht den Einsatz von Techniken zur synthetischen Datengenerierung (hierbei kann es sich um Generative KI oder “klassische” Methoden handeln), um legitime E-Mails (“Ham”) zu erstellen, wobei der Fokus auf der Einhaltung des Datenschutzes liegt. Das Ziel besteht darin, das Training von Spam-Erkennungsmodellen zu verbessern, ohne sensible Nutzerdaten (der Ham-Mails) zu verwenden bzw. preiszugeben.

Voraussetzungen

Erforderlich

  • Grundlegendes Verständnis von künstlicher Intelligenz und maschinellem Lernen, z.B. Autoencoder oder GANs (abgeschlossener Kurs Grundlagen der Künstlichen Intelligenz)
  • Kenntnisse in Natural Language Processing Techniken
  • Programmierkenntnisse in mindestens einer gängigen Sprache (vorzugsweise Python)
  • LaTeX-Kenntnisse

Optional

  • Kurse belegt:
    • Internet-Technologie & Web Engineering
    • Fortgeschrittene Methoden des maschinellen Lernens
    • Sicherheit in Kommunikationsnetzen
  • Kenntnisse über Evaluationsmetriken für KI-Modelle
  • Grundlagenwissen über Datenschutz/datenschutzfreundliche Techniken
  • Grundlagenwissen zu Spam- und Phishing-Prinzipien