Künstliche Intelligenz zur Deepfake Erkennung


Künstliche Intelligenz zur Deepfake Erkennung
Künstliche Intelligenz zur Deepfake Erkennung
Künstliche Intelligenz zur Deepfake Erkennung
Künstliche Intelligenz zur Deepfake Erkennung

Entwicklung eines KI-basierten Demonstrator, um Menschen dabei zu unterstützen Deepfakes zu erkennen.



Problemstellung
Künstliche Intelligenz und Deep Learning haben in den letzten Jahren vieles zur Lösung komplexer Probleme beigetragen. Allerdings
findet die Technik auch negative Anwendungen. Eine davon sind sogenannte Deepfakes. Ein Deepfake ist ein Bild bzw. Video, bei dem mithilfe von Deep Learning ein Gesicht und/oder der Audioinhalt ausgetauscht wird. In Videos beispielsweise können Gesichtsteile so verändert werden, dass es den Anschein erweckt, als ob dieselbe Person im Vergleich zum Original etwas gänzlich anderes von sich gibt. Diese Technik ist mittlerweile so weit, dass sie von Menschen nur noch schwierig oder gar nicht identifiziert werden kann.In Zeiten von social Media verbreiten sich „Fake News“ leicht und können schnell erheblichen Schaden an Personen und Unternehmen anrichten. Das Ziel dieses Projekts ist es eine Anwendung zu entwickeln, welche mittels künstlicher Intelligenz gefälscht Inhalte erkennt.

Datenbeschaffung
Um eine hohe Genauigkeit zu erzielen wird das Netz auf zwei Datensets mit mehr als 1000GB Videomaterial trainiert. Dadurch lernt die KI unterschiedliche Deepfakes zu erkennen. Zu Beginn wird das Datenset in reale und gefälschte Videos unterteilt. Um die Daten möglichst kompakt zu halten, werden sie vor dem Training mittels OpenCV eingelesen, in Frames unterteilt und anschließend auf das Gesicht zugeschnitten. Somit lassen sich lange Durchlaufzeiten vermeiden.

Implementierung
Die Meso-Net-Methode ist eine bekannte Technik zur Erkennung von Deepfakes. Diese versucht, mit Hilfe eines Neuronalen Netzwerkes, mesoskopische Bildunterschiede in Videosequenzen zu erkennen. Das Netz besteht aus zwei Teilen. Der Convolutional Teil, der aus vier Convolutionalschichten besteht, die Bilddetails extrahiert und verdichtet. Darüber hinaus gibt es zwei voll verbundene Denseschichten mit einer abschließenden Sigmoid Aktivierungsfunktion, die bestimmt, ob es sich um ein gefälschtes oder reales Video handelt. Das fertige Modell ist in der Lage mit mehr als 65% ein Videoausschnitt richtig zu klassifizieren.


  • Jahr:
  • Studierende: Niklas Chromik, Simon Bader, Michael Mai, Tim Krüger, Robert Stertz, Numan Yerlesmek
  • Semester: semesterübergreifend
  • Studiengang: Studiengangsuebergreifend
  • Supervision: Prof. Dr. Björn Häckel
  • Tags: Künstliche Intelligenz, Deepfake, Lernszenarien, KI-Demonstrator