Plainlyy



Plainlyy
Plainlyy
Plainlyy

Eine KI unterstützte Cloud-Solution zur Textvereinfachung von englischen Texten.



Plainlyy ist eine KI-unterstütze cloudbasierte Anwendung zur Vereinfachung von Texten in englischer Sprache.
Ziel ist es, komplexe/komplizierte englische Sätze zu vereinfachen und so für möglichst viele Menschen verständlich zu machen.

In der deutschen Sprache gibt es zu diesem Zweck sogenannte leichte Sprache, in der auch Ämter über Ihre Webseiten kommunizieren. Es gibt in Deutschland circa 10 Millionen Menschen, die auf leichte Sprache angewiesen sind. Für die englische Sprache gibt es das Äquivalent ‚Plain English‘, wobei auch Webseiten wie Wikipedia teilweise englische Texte in vereinfachter Sprache anbieten. Seit 2010 gibt es in den USA den ‚Plain Writing Act‘, welcher Regularien definiert, wann sogenanntes ‚Plain English‘ angeboten werden muss. Mit Plainlyy werden komplexe englische Texte einfacher zugänglich gemacht und vereinfacht. So haben auch Nicht-Muttersprachler einen besseren Zugang zur englischen Sprache.

In der maschinellen Sprachverarbeitung dominiert seit einigen Jahren ein bestimmtes Modell der neuronalen Netze: der Transformer. Im Gegensatz zu vorherigen neuronalen Netzen mit einem ‚Gedächtnis‘, benutzen Transformer den sogenannten Attention-Mechanismus. Dieser ermöglicht es dem Netz den Kontext eines Textes über längere Abschnitte zu halten und korrekt zu interpretieren. Wir verwenden ein etabliertes vortrainiertes Model namens T5, welches wir für unseren Anwendungsfall weiter trainiert haben. Als Trainingsdaten verwenden wir hierzu den Wiki-Large Datensatz, welchen wir zusätzlich angepasst und bereinigt haben. Der Wiki-Large basiert auf ‚Plain English‘-Texten aus Wikipedia und umfasst ca. 240.000 Satzpaare. Für unser Training haben wir TPUs in Google Colab verwendet. Das Training für unser finales Modell dauerte circa 48 Stunden.

Unser Model ist auf HuggingFace zum Download verfügbar und wird ebenfalls über eine Azure-Web-Applikation zur Verfügung gestellt.
Als Partner wurde die Projektgruppe unterstützt durch das Münchner Startup SUMM. Das Team von SUMM - bestehend aus Absolvent:innen der TU München - hat das „deepL“ für deutsche Leichte Sprache entwickelt: Ein KI-basiertes Tool, das automatisch jeden komplizierten Text in Leichte Sprache übersetzt.


  • Jahr:
  • Studierende: Maximilian Asam, Tim Betz, Philipp Gaag, Corsin Geiss, Ivan Lukic, Veronika Ruppert
  • Semester: 4./6. Semester
  • Studiengang: Informatik
  • Supervision: Prof. Dr. Arne Mayer
  • Tags: KI, AI, Cloud, Transformer, NLP, Machine Learning