IT-Forschung

Lügendetektor im Netz

Ein Lügendetektor
Feueralarm am Riesenrad? Forscher arbeiten an einer Software, die im Internet Falschmeldungen automatisch erkennt. © picture-alliance / dpa
Von Dirk Asendorpf · 05.05.2014
Wahr oder unwahr – das ist im Internet oft schwer zu unterscheiden. Dabei können Fehlinformationen gravierende Folgen haben. Eine Software soll Online-Falschmeldungen bald automatisch erkennen und so möglicherweise Leben retten.
Feuerwehrsirenen, Menschen schreien. Feueralarm im Riesenrad: London Eye, der Touristenmagnet am Londoner Themseufer steht in Flammen. Sekundenschnell verbreitet sich die Nachricht über die sozialen Netzwerke im Internet. Schon nach wenigen Minuten taucht sie auch in journalistischen Online-Medien auf – mit Bezug auf Augenzeugenberichte bei Twitter. Das Feuer ist zwar nur erfunden, doch die Folgen solcher Falschmeldungen im Netz können gravierend sein – vom Börsencrash bis zur Massenhysterie. Ein automatisches Frühwarnsystem könnte die schlimmsten Folgen verhindern. Doch die technische Umsetzung ist kompliziert. Ein europaweites Forschungsprojekt soll jetzt die Grundlagen dafür legen. Aus Deutschland ist der Computerlinguist Thierry Declerck von der Universität des Saarlandes dabei.
Thierry Declerck: "Wir reden von etwa 500.000 Tweets am Tag und neun Millionen Facebook-Einträge pro Stunde, Tendenz steigend. Und diese riesige Menge an Daten muss erst mal verarbeitet werden mit ganz robusten Methoden, die im Prinzip das rausfiltern, wonach man sucht, zum Beispiel nach Schlüsselwörtern."
Wichtig ist zunächst der Ursprung und Verbreitungsweg einer Behauptung. Wenn sie in kurzer Zeit hundertfach kopiert und weitergeleitet wird, ist das ein klarer Hinweis auf ihre Bedeutung. Ob sie auch plausibel ist, soll im nächsten Schritt automatisch geprüft werden.
"Dann müssen diese Daten untersucht werden, ob's da auch Widersprüche gibt. Die Presse ist für uns eine sehr zentrale Quelle, dann gibt's auch die Enzyklopädien, die online sind, aber auch viele Regierungsdaten, zum Beispiel von der Bundesregierung. Das sind einfach Daten, die wir erst mal glauben wollen als Fakt. Man muss wissen, dass London Eye aus Metall ist, und wenn London Eye aus Metall ist, dann kann es nicht brennen."
Dublin lässt soziale Netzwerke automatisch durchsuchen
Ein rasend schneller Abgleich der Netzkommunikation mit Gigabyte an gespeichertem Wissen – es klingt wie Science-Fiction, doch tatsächlich findet so etwas bereits statt, zum Beispiel in Dublin. Bereits heute lässt die Stadtverwaltung der irischen Hauptstadt soziale Netzwerke automatisch durchsuchen nach Informationen, die Aufschluss über mögliche Probleme mit der öffentlichen Infrastruktur geben. IBM Research hat die Software dafür entwickelt, Mike Kehoe leitet die zuständige Abteilung.
Mike Kehoe: "Wir haben ein Produkt, das heißt Soziale Netzwerk Analyse. Es verbindet sich direkt mit Twitter, Facebook und Blogs. Das System kann selbstständig relevante Schlagworte bestimmen und die sozialen Netze danach durchforsten. Es kann Zusammenhänge erkennen und gezielt nach negativen oder positiven Äußerungen suchen. Es zeigt Ihnen dann diese Tabellen hier an. Darauf sehen Sie, über wie viele negative und positive Dinge geredet wird. Darin kommen die Stimmungen der Menschen zum Ausdruck, zum Beispiel ‚Ich fühle mich nicht sicher' oder ‚Die Wasserleitung hier sieht aus als wäre sie kaputt und könnte bersten.'"
Die Software ist lernfähig. Je länger sie in Betrieb ist, desto genauer erkennt sie die Themen und den Inhalt der Kommunikation im Netz. Und sie entdeckt Ungereimtheiten: Zum Beispiel während der Unruhen in Tottenham, London. In der städtischen Telefonzentrale ging ein Notruf ein. Ein Ladengeschäft brennt, sagte der Anrufer. Doch auf Twitter und in den sozialen Netzen tauchte nichts davon auf.
"Das ist schon sehr ungewöhnlich. Sie haben dann trotzdem die Feuerwehr losgeschickt, aber gleichzeitig auch einen Streifenwagen, um sie zu schützen. Mit gutem Grund, wie sich schnell zeigte. Denn kaum war die Feuerwehr vor Ort, wurde sie auch schon von einem Mob angegriffen. Sie ist sofort umgedreht, es war ja offensichtlich ein Fehlalarm. Wenn eine einzige Person über etwas berichtet, sonst aber niemand, dann ist das verdächtig. In unserem System können wir deshalb festgelegen: Erst wenn zehn verschiedene Leute von zehn unterschiedlichen Internetadressen ein Ereignis erwähnen, dann starten wir unsere Analyse."
Thierry Declerck und seine europäischen Forschungskollegen wollen noch einen Schritt weiter kommen. Automatisch soll ihre Software auch die verwendete Sprache, die Worte und den Satzbau einer Nachricht unter die Lupe nehmen. Mit derartiger Textanalyse wollen sie auf Spekulationen, Debatten oder Ungereimtheiten schließen und sogar Lügnern auf die Schliche kommen.
"Der schwierigste Punkt ist, ob jemand wissentlich etwas Falsches sagt."
Thierry Declerck: "Der schwierigste Punkt wäre zu erkennen, ob jemand wissentlich etwas Falsches sagt. Wir unterscheiden zwischen Desinformation, was wirklich absichtlich gemacht wird, und Missinformation. Es gibt viele Leute, die etwas weitervermitteln, aber die haben sich einfach geirrt. Wenn wir das erkennen können, sind wir schon sehr zufrieden."
Eindeutige Antworten wird der Internet-Lügendetektor auf diese Fragen wohl niemals geben können. Eine klare Einteilung in wahr oder falsch ist auch gar nicht das Ziel des Forschungsprojekts. Wenn die Software im nächsten Jahr in einer ersten Pilotversion vorgestellt wird, soll sie nur die Wahrscheinlichkeit dafür angeben, ob eine Behauptung oder Nachricht im Netz zutreffend ist. Im Mittelpunkt stehen dabei zunächst medizinische Ratschläge. Welche Konsequenzen man aus dieser Information zieht, muss am Ende jeder selbst entscheiden. Eine Cyber-Denkpolizei hat der studierte Philosoph Thierry Declerck jedenfalls nicht im Sinn. Ihm geht es um ein möglichst praxistaugliches Assistenzsystem.
"Ob die Maschine für uns Entscheidungen trifft? Da würde ich wirklich sagen: Nein, das will ich nicht. Wir wollen wirklich eine Hilfe anbieten und dann müssen die Leute, die mit den Daten arbeiten am Schluss eine Entscheidung treffen. Aber die treffen diese Entscheidung auf der Grundlage einer reduzierten Datenmenge und mit Links zu anderen Datenquellen, also eine semiautomatische Entscheidungsprozedur. Das wäre wirklich ganz gut in so einem System."