Wien (pts018/25.07.2018/12:00) – Sexuelle Übergriffe in Online Chats und sozialen Netzen nehmen zu. Methoden der künstlichen Intelligenz helfen sexuelle Inhalte zu identifizieren. Das IT-Unternehmen Calista stellt einen Algorithmus vor, der von jedem ausprobiert werden kann!
Nicht nur das gesellschaftlich aktuelle Thema # METOO, sondern auch die Kundenunzufriedenheit auf den hauseigenen Chatplattformen Topiic.com und Quatscha.at hat Calista zu dieser Lösung bewegt! Seit über drei Jahren beschäftigen sie sich mit verschiedenen Techniken des maschinellen Lernens, einem Teilbereich der künstlichen Intelligenz. Einer der Kompetenzbereiche des Unternehmens ist Natural Language Processing, das alle Techniken und Methoden zur maschinellen Verarbeitung natürlicher Sprache beschreibt.
Sexuelle Inhalte identifizieren – Selber ausprobieren
Auf der Website https://ai.calista.at kann sich ab sofort jeder selbst ein Bild machen: Wörter, Phrasen oder ganze Sätze können über das erste Eingabefeld auf ihren sexuellen Inhalt hin getestet werden.
Ein Sprachmodell lernt Österreichisch
Der Algorithmus beruht auf einem Sprachmodell, das aus 100 Mio. anonymisierten Online Chat Nachrichten gebildet wurde. Sprachmodelle erfüllen ihre Aufgabe am besten, wenn die zugrundeliegenden Texte den zu untersuchenden Texten sehr ähnlich sind. In diesem Fall ist es eine Mischung aus Hochdeutsch und unterschiedlichsten österreichischen Dialekten. Das Modell erkennt dadurch Zusammenhänge zwischen einzelnen Wörtern. Es weiß z.B., dass „Schatzi“ und „Mausi“ etwas gemeinsam haben. Lernt ein neuronales Netz, dass die Aussage „Hallo Schatzi“ als Belästigung eingestuft werden soll, so kann es ableiten, dass dies für „Hallo Mausi“ ebenso gelten soll, ohne dass das Wort „Mausi“ in den Trainingsdaten vorgekommen ist. Dadurch werden mit wesentlich weniger Trainingsdaten bessere Ergebnisse erzielt.
Ein zweites Eingabefeld erlaubt mit dem Sprachmodell zu experimentieren. Gibt man ein Wort ein, erhält man sinnverwandte Wörter oder Wörter mit ähnlichen inhaltlichen Eigenschaften. Das Wort „Madl“ liefert als Ergebnis einen Querschnitt durch die österreichischen Dialekte: „medl, mädl, diandl, mädal, diandle, …“. Beim „knedl“ erkennt das Modell zumindest den Zusammenhang mit Essen: „kropfn, opfi, krapfn, opflstrudl, hendlhaxn, … „. Der Begriff „Fernsehen“ zeigt, dass Österreicher genauso gern „fernschauen“ wie „fernsehen“. An „ferngucken“ erkennt man die Spuren einiger deutscher Online Chatter oder den stetigen Einfluss deutscher Medien auf Österreich.
Was kommt als nächstes?
Das bestehende Modell wird von Calista stetig optimiert. Bei Falschklassifizierungen kann das System gezielt trainiert und „Wissenslücken“ geschlossen werden. In Kürze werden die Funktionen auch als Webservice zur Verfügung stehen.
Das Erkennen von Beleidigungen und Beschimpfungen in der Online Kommunikation ist als nächstes geplant. Einsatzgebiete für die neuen Funktionen sind soziale Netzwerke, Chats, Flirt & Dating Plattformen, Foren, Services mit Kommentarfunktion und alle anderen Anwendungen mit Kommunikation zwischen den Nutzern.
Über Calista
Calista, gegründet 1999 mit Sitz in Wien, ist ein IT Dienstleistungsunternehmen mit breiter Projekterfahrung. Seit über 15 Jahren entwickeln und betreiben sie, vor allem für Mobilfunkbetreiber, mobile Community- und Mailanwendungen. Künstliche Intelligenz kam erstmals für das Projekt Topiic.com zum Einsatz, eine Online Community mit Themenerkennung, Erkennung der aktuellen Stimmung, einem Empfehlungssystem für Kontakte mit ähnlichen Gesprächsthemen und integriertem Chatbot.
(Ende)
Aussender: Oberreiter & Dandachi OG – Calista Ansprechpartner: DI Raimund Oberreiter Tel.: +43 1 403 30 640 E-Mail: raimund.oberreiter@calista.at Website: ai.calista.at