Abschlussarbeit
Synthetische Erzeugung von Ham-E-Mails zur Verbesserung des Spam-Klassifikationstrainings
Betreuer
Thesis: Masterarbeit
Diese Arbeit untersucht den Einsatz von Techniken zur synthetischen Datengenerierung (hierbei kann es sich um Generative KI oder “klassische” Methoden handeln), um legitime E-Mails (“Ham”) zu erstellen, wobei der Fokus auf der Einhaltung des Datenschutzes liegt. Das Ziel besteht darin, das Training von Spam-Erkennungsmodellen zu verbessern, ohne sensible Nutzerdaten (der Ham-Mails) zu verwenden bzw. preiszugeben.
Voraussetzungen
Erforderlich
- Grundlegendes Verständnis von künstlicher Intelligenz und maschinellem Lernen, z.B. Autoencoder oder GANs (abgeschlossener Kurs Grundlagen der Künstlichen Intelligenz)
- Kenntnisse in Natural Language Processing Techniken
- Programmierkenntnisse in mindestens einer gängigen Sprache (vorzugsweise Python)
- LaTeX-Kenntnisse
Optional
- Kurse belegt:
- Internet-Technologie & Web Engineering
- Fortgeschrittene Methoden des maschinellen Lernens
- Sicherheit in Kommunikationsnetzen
- Kenntnisse über Evaluationsmetriken für KI-Modelle
- Grundlagenwissen über Datenschutz/datenschutzfreundliche Techniken
- Grundlagenwissen zu Spam- und Phishing-Prinzipien