Go-Duell Mensch vs. Software Spiel vier geht an den Go-Profi

Nachdem die Google-Software AlphaGo am Samstag das Duell gegen den südkoreanischen Go-Meister mit 3:0 für sich entschieden hatte, folgte nun eine überraschende Wendung.

Lee Sedol nach seinem Sieg
REUTERS

Lee Sedol nach seinem Sieg


AlphaGo vs. Lee Sedol
  • Corbis
    Der wohl weltbeste Go-Profi Lee Sedol spielt fünf Partien gegen die Deepmind-Software AlphaGo. Ausgetragen werden die Partien am 9., 10., 12., 13. und 15. März im Four Seasons Hotel in Seoul, Südkorea. Die Partien beginnen jeweils um fünf Uhr morgens deutscher Zeit und werden bei YouTube als Livestream übertragen.
Als Go-Profi Lee Sedol am Samstag zum dritten Mal gegen die Google-Software AlphaGo verlor, waren Fans des Brettspiels auf der ganzen Welt geschockt. Bereits in der dritten von fünf Partien besiegte das Programm den Menschen durch technischen K.o.

Experten sagten: Das Ergebnis und die erstaunlichen Züge, die AlphaGo mitunter zeigte, läuteten ein neues Kapitel in der Entwicklung künstlicher Intelligenzen ein: Ab sofort können Programme nicht mehr nur tun, was der Mensch ihnen zuvor beigebracht hat. Durch künstliche neuronale Netzwerke können sie nun selbst lernen, trainieren, eigene und ungewöhnliche Schlüsse ziehen.

Es schien, als sei die Google-Software AlphaGo ihren menschlichen Gegenspielern für immer davongeeilt.

Einen Tag und ein Spiel später ist der Rechner zwar noch immer Sieger in diesem historischen Match. Doch es ist etwas passiert, das viele erstaunen dürfte: Die vierte Partie gewann Lee Sedol. Nach rund viereinhalb Stunden und 184 Zügen gab die Software sich geschlagen.

Es scheint, als hätte der südkoreanische Go-Profi schneller aus den Taktiken des Computers gelernt als umgekehrt.

Neuronale Netzwerke: Die Geschichte
Neuronales Netz: Knoten und gewichtete Verbindungen
David E. Rumelhart/ James L. McClelland

Neuronales Netz: Knoten und gewichtete Verbindungen

Die Idee, dass man die Morphologie des menschlichen Nervensystems nachbilden könnte, um Maschinen so etwas wie denken, lernen oder Wahrnehmung beizubringen, stammt schon aus den Vierzigerjahren des vergangenen Jahrhunderts. Lange Zeit aber blieben die sogenannten neuronalen Netzwerkmodelle eher rudimentär, ein Gebiet für Spezialisten mit besonderer Liebe zur Abstraktion. Dann, in der ersten Hälfte der Achtzigerjahre, änderte sich das vor allem dank einer einzigen Studie. Die Psychologen David Rumelhart und James McClelland zeigten, dass so ein extrem rudimentäres Pseudogehirn lernen kann, die Vergangenheitsformen englischer Verben korrekt zu bilden - und im Laufe des Lernprozesses vorübergehend die gleichen Fehler macht wie ein menschliches Kind beim gleichen Vorgang. Statt "went" warf das Netz als Antwort vorübergehend "goed" aus - es wendete also die Regel korrekt an, aber eben bei einem unregelmäßigen Verb.

Das Netzwerk lernte also Regeln und anschließend auch die Ausnahmen von diesen Regeln - ohne dass eine einzige Regel jemals explizit formuliert worden wäre. Die Studie löste in den Kognitionswissenschaften einen kleinen Boom aus, plötzlich wurden neuronale Netzwerkmodelle auf alle möglichen Fragestellungen angewendet, der Begriff "Konnektionismus" für die neue Wissenschaft kam auf. Dann kam das Internet, die digitale Revolution nahm ihren Lauf, und plötzlich gab es Rechenleistung und entsprechende Computer in Hülle und Fülle. Heute sind neuronale Netzwerke nicht mehr nur Modelle für Psychologen - sie sind zu mächtigen Werkzeugen in den Händen jener geworden, die Computern das Sehen, Denken, Deuten beibringen wollen.

Das Grundprinzip, nach dem solche neuronalen Netzwerke funktionieren, ist immer das gleiche. Sie bestehen aus zwei oder mehr Schichten von Knoten, simulierten Nervenzellen. Verbunden werden diese Schichten mit vielen Verknüpfungen. In der Regel ist jeder Knoten der einen Schicht mit allen Knoten der nächsten verbunden. Die Input-Knoten stehen für elementare Merkmale, sie könnten beispielsweise die Pixel eines vorgegebenen Bildes repräsentieren.

Wird ein Input-Knoten aktiviert, reichte er diese Aktivierung über seine Verbindungen an die Knoten der nächsten Schicht weiter. Die Verbindungen wurden gewichtet - man kann sie sich als unterschiedlich dick vorstellen. Je dicker die Verbindung, desto stärker die Aktivierung, die am nächsten Knoten ankommt. Belehrt wird so ein Netzwerk gewissermaßen rückwärts: Wenn die Output-Schicht nicht das gewünschte Ergebnis produziert, werden die Gewichtungen der Verbindungen mithilfe eines mathematischen Mechanismus Schicht für Schicht so angepasst, dass das Ergebnis beim nächsten Mal besser zum tatsächlichen Input passt. Mit vielen Durchgängen können die Netze so lernen, Inputs korrekt mit Outputs zu verknüpfen.

cis

bma



Forum - Diskutieren Sie über diesen Artikel
insgesamt 18 Beiträge
Alle Kommentare öffnen
Seite 1
Creedo! 13.03.2016
1.
Vielleicht ist das Go-Programm aber auch ein netter Gewinner und läßt jetzt den Menschen generös gewinnen, um ihn nicht zu demütigen. Gewonnen hat das Programm ja so oder so schon. Vielleicht war ob des bereits feststehendes Sieges des Go-Programmes dieses auch nicht mehr bei der Sache und hat sich parallel Schach beigebracht.
gympanse 13.03.2016
2.
Das Programm hat Empathie gezeigt und wollte Lee nicht demütigen. Es ist also bereits jetzt den modernen Menschen überlegen, die dies immer weniger beherrschen. :)
Berliner42 13.03.2016
3.
AlphaGo ist also sogar nett. Es wird immer erstaunlicher.
querulant_99 13.03.2016
4.
Vielleicht hat DeepMind etwas nachgeholfen und den Elo-Regler etwas zurückgedreht, damit die Partie interessant bleibt.
mansiehtnurmitdemherzengu 13.03.2016
5. Und jetzt?
Stürzt jetzt die Alphabet-Aktie ins Bodenlose? Gestern noch haben sich ja mehrere Kolumnisten verschiedener Plattformen zu Prophetien verstiegen, die nichts weniger als den Anbruch einer neuen Zeitrechnung sahen. Heute lernen wir, dasss Kollege Computer doch nicht so clever ist, wie man uns glauben machen will. Die Dummen werden wieder mal die sein, die ihre Hoffnungen in diese glorifizierten Taschenrechner gesetzt haben.
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2016
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.