12.05.2016 — Online-Redaktion Verlag Dashöfer. Quelle: Universität Bielefeld.
Diskussionen im Internet sind kaum zu erfassen, sei es die Kontroverse um das Handelsabkommen TTIP oder die Debatte um Flüchtlinge: Sie laufen manchmal über Jahre, die Zahl der Diskussionsbeiträge geht in die Millionen. Ein neues Schwerpunktprogramm der Deutschen Forschungsgemeinschaft (DFG) soll für Klarheit sorgen. Bundesweit arbeiten Wissenschaftlerinnen und Wissenschaftler ab 2017 an Suchmaschinen für Argumente. Die technischen Systeme sollen zum Beispiel analysieren, wie Gruppen – etwa Pegida oder Globalisierungsgegner – in Onlinediskussionen argumentieren. Die Universität Bielefeld leitet das Programm „Ratio“. Beteiligt sind die Jacobs University Bremen, die Universität Duisburg-Essen, die Universität Leipzig und die Bauhaus-Universität Weimar.
Der volle Titel des DFG-Schwerpunktprogramms heißt „Robust Argumentation Machines“ (Adaptive, Skalierbare und Fehlertolerante Argumentationsmaschinen).
„Wir wollen den Grundstein für eine neue Technologie legen, die automatisiert digitale Texte auswertet, die argumentativen Strukturen erkennt und zusammenfasst und die verschiedenen Pro- und Contra-Argumente zu einer Diskussion auf einen Blick zusammenfasst“, sagt Philipp Cimiano. Er ist Leiter der Forschungsgruppe „Semantische Datenbanken“, die am Exzellenzcluster CITEC arbeitet. Sein Team ist spezialisiert auf der Erforschung und Entwicklung von Verfahren, die „Bedeutung“ aus unstrukturierten Daten, insbesondere aus digitalen Texten, extrahieren und zusammenfassen können.
Politikforscher könnten mit der neuen Generation von Systemen beispielsweise analysieren, wie Menschen im Internet über ein Thema denken und reden. In der Diskussion um Flüchtlinge sei von vielen Menschen die sogenannte „Schließung der Balkanroute“ als das Mittel der Wahl benannt worden. Die neuen Argumentationsmaschinen würden nicht nur aufspüren, wie viel Zuspruch diese „Lösung“ erhalten hat, sondern auch, welche Gegenargumente aufgeführt werden. „Grundsätzlich könnten sie auch darstellen, welche Argumente überholt sind und welche neu in die Diskussion eingeführt wurden“, sagt Philipp Cimiano.
Die Industrie arbeitet seit Jahren an Systemen, die Datenmengen („Big Data“) automatisch durchforsten und auswerten. „Das Problem dabei ist, dass unklar bleibt, worauf diese Systeme ihre Informationen beziehen und wie sie ihre Vorschläge begründen“, sagt Cimiano. „Unsere Systeme sollen weiter gehen als bisherige Projekte.“ Sie sollen unstrukturierte Dokumente analysieren, argumentative Zusammenhänge herausziehen und verständlich vermitteln. Und sie sollen nicht nur Handlungsempfehlungen geben, sondern diese Vorschläge begründen und auf Quellen und weiterführende Informationen hinweisen. „Uns geht es darum, Transparenz in die Big-Data-Analyse zu bringen“, sagt der CITEC-Wissenschaftler. „Wir arbeiten an intelligenten Beratungssystemen, die den Nutzern ihre selbstständige Entscheidung lassen.“
Die Analyse von Online-Diskussionen ist nur ein mögliches Einsatzgebiet der Argumentationsmaschinen. Die neuen Systeme sollen Expertinnen und Experten verschiedener Branchen bei der Entscheidungsfindung unterstützen, zum Beispiel in der Finanzbranche, der Medizin, der Technischen Dokumentation, Politik und Soziologie. So könnte zum Beispiel ein System entwickelt werden, das von Ärzten zu Rate gezogen werden kann. Das System scannt Millionen von Fachartikeln zu Krankheitsbildern und Therapien. Der Arzt kann den digitalen Beratungshelfer befragen – dank eines Dialogassistenten – und erfährt auf diese Weise zum Beispiel von einer neuen Therapie, die er selbst nicht aufgespürt hätte. Auch in der industriellen Fertigung könnte solch ein System assistieren: Wenn etwa eine Maschine nicht funktioniert, könnte das Beratungssystem Anleitungen, Dokumentationen oder auch Internetforen „lesen“ und Vorschläge zur Fehlerbehebung ableiten. Auch Journalisten könnten profitieren, indem die Systeme frei verfügbare Daten der öffentlichen Verwaltung oder zugespielte Daten wie die „Panama Papers“ auswerten.
Das Schwerpunktprogramm bringt Forscherinnen und Forscher aus einer Reihe von Teildisziplinen der Informatik zusammen: Künstliche Intelligenz, Computerlinguistik, Wissensrepräsentation, Suchmaschinen, Semantisches Web und Mensch-Maschine-Interaktion. „Ratio“ läuft von 2017 bis 2023. Für die Forschung im Schwerpunktprogramm stehen pro Jahr zwei Millionen Euro zur Verfügung, also insgesamt zwölf Millionen Euro. Zum Programmausschuss gehören: Professor Dr. Philipp Cimiano (Universität Bielefeld), Professor Dr. Gerhard Heyer (Universität Leipzig), Professor Dr. Benno Stein (Bauhaus-Universität Weimar), Professor Dr. Michael Kohlhase (Jacobs University Bremen) und Professor Dr. Jürgen Ziegler (Universität Duisburg-Essen).