Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.

Wahrheits-Check: Software erkennt Lügen

Von

Supercomputer (Archivbild): Algorithmus übernimmt Fact-checking Zur Großansicht
Forschungszentrum Juelich, UK

Supercomputer (Archivbild): Algorithmus übernimmt Fact-checking

Stimmt's? Oder lügt da jemand? Forscher haben eine Software entwickelt, die Wahres von Falschem unterscheiden kann.

Wem kann man heutzutage noch trauen? Auf Facebook machen Videos die Runde, die womöglich gefälscht sind. Im Onlinelexikon Wikipedia kann jeder Artikel manipuliert sein. Und wer will schon glauben, was in E-Mail-Kettenbriefen steht?

Das Überprüfen von Aussagen, im Englischen Fact-checking genannt, ist mitunter sehr aufwendig. Große Zeitungen und Magazine, darunter auch der SPIEGEL, haben eigene Abteilungen, die sich allein um die Prüfung von Fakten kümmern.

Wissenschaftler der University of Indiana in Bloomington haben jetzt eine Software entwickelt, die den Wahrheitsgehalt einfacher Aussagen berechnet. Giovanni Ciampaglia und seine Kollegen nutzen dabei ein Wissensnetzwerk, auch Knowledge Graph genannt.

Die Forscher fütterten ihre Software mit dem Inhalt von Infoboxen aus Wikipedia, die wichtige Fakten über Personen oder Dinge enthalten. Beispiel: Im Kasten von Barack Obama, den es nur in der englischen Artikelversion gibt, finden sich sein Geburtstag, Details zur Ausbildung und zu den Karrierestationen.

Ist Sokrates ein Mensch?

Aus solchen Infoboxen extrahierten die Wissenschaftler drei Millionen Begriffe, die durch 23 Millionen Links miteinander verbunden waren. Beispiele für solche Verbindungen sind "Sokrates ist ein Philosoph" und "Paris ist die Hauptstadt von Frankreich".

Gehirn: Wie gut verstehen Computer menschliche Sprache? Zur Großansicht
Corbis

Gehirn: Wie gut verstehen Computer menschliche Sprache?

Eine Aussage ist wahr, wenn Subjekt und Objekt miteinander verbunden sind, wie "Sokrates" und "Mensch". Zwischen "Sokrates" und "Tier" hingegen dürfte keine Verbindung existieren. Es gibt im Knowledge Graphen auch Verknüpfungen, die über mehrere Stationen laufen. Beispiel: "Sokrates" und "Mensch". "Sokrates" und "Philosoph" sind miteinander verbunden - und "Philosoph" und "Mensch" auch. Daraus folgert die Software, dass Sokrates ein Mensch ist. Die Verbindung kann auch über mehr als zwei Stationen laufen, also länger sein.

Ihren Fact-checking-Algorithmus testeten die Forscher mit Aussagen wie "Barack Obama ist Präsident der USA". Um es der Software nicht zu einfach zu machen, entfernten die Wissenschaftler vor der Abfrage den direkten Link zwischen Obama und US-Präsident aus dessen Wikipedia-Infobox. Die Software musste dann nach indirekten Verbindungen fahnden - und aus den Treffern den Wahrheitsscore berechnen, der zwischen Null und Eins liegt.

Substanzlose Gerüchte und Verschwörungstheorien

Der Aussage "Obama ist Präsident" ordnete die Software einen hohen Score zu, dem Satz "Obama ist Muslim" hingegen nicht, schreiben die Forscher im Fachblatt "PLOS ONE". Tatsächlich wahre Aussagen hätten einen höheren Wahrheitsscore erhalten als falsche.

Für die Bestimmung des Wahrheitsgehalts von Aussagen seien indirekte Verbindungen offenbar entscheidend, sagte Giovanni Ciampaglia. Erst wenn der Algorithmus auch längere Wege zwischen zwei Begriffen nehmen durfte, habe er gute Ergebnisse geliefert.

"Die Ergebnisse sind ermutigend und spannend", sagte der Forscher. "Wir leben im Zeitalter des Informationsüberflusses." Es kursierten falsche Informationen, substanzlose Gerüchte und Verschwörungstheorien. Das Ausmaß dieser Falschaussagen bedrohe den Journalismus und die Öffentlichkeit gleichermaßen. Die Studie zeige, dass man Fact-checking in ein Netzwerk-Problem überführen könne, das sich leicht mit Computern lösen lasse.

Computer gewinnt Spielshow

In den vergangenen Jahren haben Informatiker große Fortschritte in der maschinellen Verarbeitung von Texten gemacht. Dabei nutzen sie ganz unterschiedliche Ansätze. Google setzt beim automatischen Übersetzen von Webseiten beispielsweise ganz auf die Macht der Statistik. Der Algorithmus greift auf Tausende korrekte Übersetzungen zurück, um jene Übersetzung zu berechnen, die wahrscheinlich die richtige ist. Ein inhaltliches Verständnis des Textes braucht der Algorithmus dafür nicht.

IBM hat mit Watson eine Software entwickelt, die in natürlicher Sprache gestellte Fragen beantworten kann. 2011 besiegte Watson sogar zwei Menschen in der TV-Quizshow "Jeopardy", die dort zuvor hohe Gewinne erzielt hatten. Die Software analysiert eingegebene Sätze unter anderem linguistisch, um deren logische Struktur zu erkennen. Watson nutzt aber wie auch Googles Übersetzungsprogramm umfangreiche Textbestände.

Der Tag, an dem eine Software automatisch alle inhaltlichen Fehler in einem Text findet, liegt sicher noch weit weg. Vor allem, wenn die dafür nötigen Informationen nirgends auf der Welt digital verfügbar sind, kann der Algorithmus letztlich nur raten. Ein kritisch denkender Mensch würde in einem solchen Fall wohl anfangen zu recherchieren. Aber wer weiß - irgendwann beherrschen Computer womöglich auch das.

Diesen Artikel...
Forum - Diskutieren Sie über diesen Artikel
insgesamt 23 Beiträge
Alle Kommentare öffnen
    Seite 1    
1. Super
flieger56 26.06.2015
...dann sollte die Software so schnell wie möglich bei allen Politikern angewendet werden !
2. Die Ergebnisse sind ermutigend und spannend
bold_ 26.06.2015
- naja, der muß ja so reden... Nun, Computer haben die Aufgabe, Menschen zu unterstützen. Es gibt aber heute schon viele Computer/Maschinen, die Menschen ersetzen und sie überflüssig machen. Die dritte Kategorie sind selbstlernende Maschinen, die auf dem besten Weg sind, das Kommando zu übernehmen, sich miteinander zu vernetzen, sich fortzupflanzen und sich auch zu warten. Bis zum Ende dieses Jahrhunderts werden wir alle zu Borgs - https://de.wikipedia.org/wiki/Völker_und_Gruppierungen_im_Star-Trek-Universum#Borg Philosophen und Journalisten wird es dann nicht mehr geben. Die CSU auch nicht...
3. Na, da bin ich aber froh, ...
Loddarithmus 26.06.2015
... dass über mich so viele Daten gesammelt werden. Dann kommt endlich raus, dass ich der Ehrlichste und Klügste bin. Wie - das kommt nicht unbedingt raus? Da muss ich ja aufpassen, uiuiui! Mir graut vor der Zukunft unserer Nachkommen.
4.
wo_st 26.06.2015
if Politiker = Yes Then Lüge. Das ist die einfachste Wahrheitsformel beim Programmieren.
5. Sie haben ja wohl verstanden, das es sich um Texte, keine
hdudeck 26.06.2015
Zitat von flieger56...dann sollte die Software so schnell wie möglich bei allen Politikern angewendet werden !
Reden handelt. Erst wenn die Rede/Aussage als Text vorliegt, kann sie geprueft werden. Ausserdem, in der dt Sprache mit den Wortverknuepfungen bis zum Wahnsinn entstehen staendig neue Begriffe, fuer die es keine "Vergleiche" gibt. Und nur wenn es einen Vergleich gibt, kann es als wahr angesehen werden (Treffer). Gerade Politiker sind bekannt fuer Worterfindungen, Schachtelsaetze und doppelte Negierungen bekannt. Da versagt doch die Software sofort. Wenn ich die Arbeitsweise der Software kenne, kann ich sie ganz einfach austricksen, indem ich geschickt wahre Fakten mit falschen mische, komplizierte Schachtelungen erstelle oder einfach Fehler in der Rechtschreibung einarbeite.
Alle Kommentare öffnen
    Seite 1    

© SPIEGEL ONLINE 2015
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH




Der kompakte Nachrichtenüberblick am Morgen: aktuell und meinungsstark. Jeden Morgen (werktags) um 6 Uhr. Bestellen Sie direkt hier: