Künstliche Intelligenz Der digitale Globetrotter mit dem menschlichen Blick

Ob Landschaftsbild, Auto oder Pferd: Ein künstliches neuronales Netz erkennt besser als Menschen, wo ein Foto aufgenommen wurde. Sogar seine Fehler scheinen sehr menschlich.

CC BY 2.0 edwin.11

Man wird irgendwo auf der Welt ausgesetzt und muss sich erst mal orientieren. So lässt sich das Gefühl beschreiben, das Spieler von "Geoguessr" überkommt. Bei dem Browser-Spiel landet man an einem zufälligen Ort in der Welt von Googles Straßenpanoramen (siehe Fotostrecke unten). Das Ziel ist es, möglichst genau zu erkennen, wo man sich befindet.

Man schaut dann auf die Sprache von Schildern oder versucht zu erkennen, auf welcher Straßenseite die Autos fahren. Menschen machen das intuitiv. Ihnen helfen Erinnerungen an Reisen, Fremdsprachenkenntnisse und ein bisschen Lebenserfahrung. Computer tun sich damit hingegen schwer. Zumindest bis jetzt. Denn der Google-Informatiker Tobias Weyand hat mit zwei Kollegen ein Programm entwickelt, das anhand eines Fotos ziemlich genau erkennt, wo dieses aufgenommen wurde.

Die Forscher nennen ihr System PlaNet. Bei ihrer Arbeit haben sie zunächst das Internet nach Fotos durchforstet. Wichtigste Voraussetzung: Die Bilddateien mussten sogenannte Exif-Daten enthalten, die den Ort der Aufnahme verraten. Weyand und seine Kollegen bekamen insgesamt 126 Millionen solcher Fotos zusammen.

Die Ergebnisse können sich sehen lassen

Dann teilten sie die Welt in 26.000 Vierecke auf. Jedoch nicht gleichmäßig: Dort wo viele Fotos aufgenommen werden, wählten sie ein feines Raster, etwa in Städten. Dort, wo kaum fotografiert wird, etwa in den Wüsten Afrikas, nutzten sie eine grobe Aufteilung. Große Teile der Ozeane oder die Antarktis sparten sie komplett aus.

Fotostrecke

11  Bilder
"Geoguessr": Mit diesem Gratis-Spiel reisen Sie um die Welt
Jetzt brachten sie einem künstlichen neuronalen Netz bei, die Fotos den einzelnen Vierecken auf der Welt zuzuordnen. Als neuronale Netze bezeichnet man in der Informatik Systeme, die nach dem Vorbild eines menschlichen Gehirns lernen. Ihr Netz fütterten die Forscher mit einem Großteil der Bilder, deren Aufnahmeort bekannt war. Das System lernte, die Bilder den einzelnen Vierecken auf der Weltkarte zuzuordnen.

Die Ergebnisse können sich sehen lassen: Die Informatiker testeten ihr Programm mit über zwei Millionen zufälligen Fotos: Knapp 30 Prozent der Bilder konnte es dem richtigen Land zuordnen, bei knapp vier Prozent war es so genau, dass es die richtige Straße fand. Die spannendste Prüfung für PlaNet war aber das Duell mit dem Menschen. Die Forscher ließen es bei Geoguessr gegen zehn menschliche Gegner antreten. Bei diesem Test gewann die Maschine 28 von 50 Runden. "Wir glauben, dass PlaNet dem Menschen überlegen ist, weil es viel mehr Orte gesehen hat, als es ein Mensch jemals könnte", schreiben Weyand und seine Kollegen. Außerdem habe das System subtile Hinweise gelernt, die einem Menschen kaum auffallen würden.

Ein sehr menschlicher Blick auf die Welt

Tatsächlich ist es interessant, was das System alles erkennt. Die Forscher haben eine Reihe von Bildern beschrieben, die es korrekt zugeordnet hat. Darunter befinden sich Fotos der New Yorker Freiheitsstatue und der Oper von Sydney. Keine besonders schweren Aufgaben. Ebenfalls korrekt erkannt hat PlaNet eine rote Telefonzelle in London und eine Altbaufassade in Paris. Aber auch Pferde und Landschaften in Island und sogar eine Graslandschaft im nördlichen Schottland konnte die Software richtig lokalisieren. "Das Modell lernt, typische Landschaften, Objekte, Architekturstile und sogar Pflanzen und Tiere zuzuordnen", fassen die Forscher zusammen.

Spannend ist aber auch, woran es scheitert. Da ist zum Beispiel das Bild eines 1948-er Chevrolet Fleetmaster. Der amerikanische Oldtimer wurde in den USA fotografiert. PlaNet berechnete jedoch fälschlicherweise, dass das Foto auf Kuba aufgenommen worden sei. Und tatsächlich denkt man auch als Mensch bei ersten Blick auf das Bild an die typisch kubanischen Straßenszenen mit alten amerikanischen Autos.

Fehlinterpretationen passierten bei PlaNet dann, wenn bestimmte Objekte typisch für Orte sind, an denen sie nicht fotografiert worden seien, schreiben die Forscher. Der Fehler zeigt aber noch etwas anderes: PlaNet lernte mit Fotos, die Menschen aufgenommen haben. Menschen fotografieren gern Klischees, wie die Oldtimer auf Kuba. Darum hat das System wohl keinen neutralen, sondern sehr menschlichen Blick auf die Welt. Und macht so ganz menschliche Fehler.

Neuronale Netzwerke: Die Geschichte
Neuronales Netz: Knoten und gewichtete Verbindungen
David E. Rumelhart/ James L. McClelland

Neuronales Netz: Knoten und gewichtete Verbindungen

Die Idee, dass man die Morphologie des menschlichen Nervensystems nachbilden könnte, um Maschinen so etwas wie denken, lernen oder Wahrnehmung beizubringen, stammt schon aus den Vierzigerjahren des vergangenen Jahrhunderts. Lange Zeit aber blieben die sogenannten neuronalen Netzwerkmodelle eher rudimentär, ein Gebiet für Spezialisten mit besonderer Liebe zur Abstraktion. Dann, in der ersten Hälfte der Achtzigerjahre, änderte sich das vor allem dank einer einzigen Studie. Die Psychologen David Rumelhart und James McClelland zeigten, dass so ein extrem rudimentäres Pseudogehirn lernen kann, die Vergangenheitsformen englischer Verben korrekt zu bilden - und im Laufe des Lernprozesses vorübergehend die gleichen Fehler macht wie ein menschliches Kind beim gleichen Vorgang. Statt "went" warf das Netz als Antwort vorübergehend "goed" aus - es wendete also die Regel korrekt an, aber eben bei einem unregelmäßigen Verb.

Das Netzwerk lernte also Regeln und anschließend auch die Ausnahmen von diesen Regeln - ohne dass eine einzige Regel jemals explizit formuliert worden wäre. Die Studie löste in den Kognitionswissenschaften einen kleinen Boom aus, plötzlich wurden neuronale Netzwerkmodelle auf alle möglichen Fragestellungen angewendet, der Begriff "Konnektionismus" für die neue Wissenschaft kam auf. Dann kam das Internet, die digitale Revolution nahm ihren Lauf, und plötzlich gab es Rechenleistung und entsprechende Computer in Hülle und Fülle. Heute sind neuronale Netzwerke nicht mehr nur Modelle für Psychologen - sie sind zu mächtigen Werkzeugen in den Händen jener geworden, die Computern das Sehen, Denken, Deuten beibringen wollen.

Das Grundprinzip, nach dem solche neuronalen Netzwerke funktionieren, ist immer das gleiche. Sie bestehen aus zwei oder mehr Schichten von Knoten, simulierten Nervenzellen. Verbunden werden diese Schichten mit vielen Verknüpfungen. In der Regel ist jeder Knoten der einen Schicht mit allen Knoten der nächsten verbunden. Die Input-Knoten stehen für elementare Merkmale, sie könnten beispielsweise die Pixel eines vorgegebenen Bildes repräsentieren.

Wird ein Input-Knoten aktiviert, reichte er diese Aktivierung über seine Verbindungen an die Knoten der nächsten Schicht weiter. Die Verbindungen wurden gewichtet - man kann sie sich als unterschiedlich dick vorstellen. Je dicker die Verbindung, desto stärker die Aktivierung, die am nächsten Knoten ankommt. Belehrt wird so ein Netzwerk gewissermaßen rückwärts: Wenn die Output-Schicht nicht das gewünschte Ergebnis produziert, werden die Gewichtungen der Verbindungen mithilfe eines mathematischen Mechanismus Schicht für Schicht so angepasst, dass das Ergebnis beim nächsten Mal besser zum tatsächlichen Input passt. Mit vielen Durchgängen können die Netze so lernen, Inputs korrekt mit Outputs zu verknüpfen.

cis

Mehr zum Thema
Newsletter
Games und Gadgets: Die Welt digital


Forum - Diskutieren Sie über diesen Artikel
insgesamt 16 Beiträge
Alle Kommentare öffnen
Seite 1
der_neue_Student 28.02.2016
1. mein Senf
das ist genauso wir beim Schachspielen. Computer haben eine riesige Datenbank und können sich alles merken, was sie "gesehen" haben. Das eigentliche "intelligente" ist das Programm. Dazu noch viele, viele schnelle Rechner. Es gibt keine Intelligenz in den Schaltkreisen! Es sei denn, die Krümel in der Tastatur fangen zu leben an.
event.staller 28.02.2016
2. Um den Begriff Intelligenz zu definieren,
bietet sich ein großes Feld an: sie findet sich z.B. bei den Pflanzen wie auch bei Tieren. Der Mensch als "Krönung" verfügt dazu u.a. immerhin über schöpferische Eigen-Verantwortung. Wer will das dem Kunst-Hirn programmieren oder soll es etwa von selbst darauf kommen?
Peer Pfeffer 28.02.2016
3.
Zu #1: bei einem neuronalen Netz können Sie im Endeffekt Programm und Daten gar nicht mehr trennen, sie nicht unterscheiden. - - - zu #2: warum müssen eigentlich bei jedem Artikel über neue Erfolge der KI-Forschung der Hinweis kommen, KI würde niemals so großartig/verantwortungsbewusst/emotional oder was auch immer sein wir die menschliche? Hat doch auch keiner behauptet.
heinel66 28.02.2016
4. Wer weiß ?
Zitat von der_neue_Studentdas ist genauso wir beim Schachspielen. Computer haben eine riesige Datenbank und können sich alles merken, was sie "gesehen" haben. Das eigentliche "intelligente" ist das Programm. Dazu noch viele, viele schnelle Rechner. Es gibt keine Intelligenz in den Schaltkreisen! Es sei denn, die Krümel in der Tastatur fangen zu leben an.
Das sehe ich genau so. Dennoch fällt es mir in letzter Zeit zunehmend schwerer hier zu differenzieren bzw. zu definieren. Das, nachdem ich mich ein wenig mehr mit NN beschäftigt habe und auch ein kleines Tool selbst ausprobiert habe, mit erstaunlichen Ergebnissen. Um in Bezug auf NN eine exakte Aussage treffen zu können fehlt mir leider das Wissen um die Biologie und Funktionsweise des menschlichen Gehirns. Da müsste ich erstmal Medizin studieren aber die Zeit habe ich ja nicht. Trotzdem mache ich hier mal eine, nicht ganz ernst gemeinte Aussage. 1. In einigen Jahren wird uns die sogenannte KI bezüglich "Intelligenz" weit übertreffen. 2. Vielleicht gibt es ja auch heute schon keine Intelligenz vor der Tastatur, die man als solche bezeichnen könnte ? Was wäre wenn sich das als Realität herausstellen würde ?
Peer Pfeffer 28.02.2016
5. Intelligenz ungleich Bewusstsein
Naja, mag sein. Dennoch fällt auf, muss man in der Diskussion sauberer trennen zwischen Intelligenz und nicht technisch definierbaren Begriffen wie Bewusstsein, Kreativität, Verantwortungsbewusstsein etc. Hier wird reflexhaft von Kritikern des Fortschritts der KI schnell mal gleichgesetzt. Ist die KI dann erst mal im eigenen Navi eingebaut, haben sie aber nichts mehr dagegen, die Frage, ob irgendwelche Krümel auf irgendwelchen Tastaturen leben, wird dann ganz schnell irrelevant.
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2016
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.