Mensch gegen Maschine Computer gewinnt erstes Go-Duell

Das Auftakt-Match ist entschieden: Der Computer AlphaGo von Google hat gegen den weltbesten Go-Spieler Lee Sedol gewonnen. Jetzt sind noch vier Partien zu spielen.

Koreanischer Go-Spieler Lee Sedol (rechts) beim DeepMind-Match
AFP

Koreanischer Go-Spieler Lee Sedol (rechts) beim DeepMind-Match


AlphaGo vs. Lee Sedol
  • Corbis
    Der wohl weltbeste Go-Profi Lee Sedol spielt fünf Partien gegen die Deepmind-Software AlphaGo. Ausgetragen werden die Partien am 9., 10., 12., 13. und 15. März im Four Seasons Hotel in Seoul, Südkorea. Die Partien beginnen jeweils um fünf Uhr morgens deutscher Zeit und werden bei YouTube als Livestream übertragen.
Im Go-Brettspielduell des Computers AlphaGo gegen Weltmeister Lee Sedol hat die Maschine die Auftakt-Partie gewonnen: Nach dreieinhalb Stunden erklärte sich Lee für geschlagen, da er keine Siegeschancen mehr sah. Damit hat er relativ schnell aufgegeben, Titelmatches können sich auch über fünf oder sechs Stunden ziehen. Insgesamt geht das Duell in der südkoreanischen Hauptstadt Seoul über fünf Partien.

Go ist ein traditionsreiches asiatisches Brettspiel, es ist noch weit komplizierter als Schach und gilt für die Künstliche Intelligenz als besonders schwer zu knacken. Hier könnte die Menschheit ihre Überlegenheit vor lernenden Maschinen noch ein paar Jahre verteidigen, glaubten manche.

Lee - der 18 internationale Titel gewann - hatte sich deswegen auch siegessicher gezeigt: Er werde haushoch gewinnen, hatte der 30-Jährige noch im Februar angekündigt.

Spielmaterial und Ziel

Go wird auf einem Brett von 19x19-Linien mit schwarzen und weißen Spielsteinen gespielt. Es wird immer abwechselnd auf die Schnittpunkte des Brettes gesetzt, wobei Schwarz beginnt. Ziel des Spieles ist es, mehr Gebiet zu machen als der andere Spieler.

Anfänger spielen meist auf einem 13x13- oder einem 9x9-Brett (siehe Diagramm), um das Spiel während der Lernphase einfacher und übersichtlicher zu halten, die Regeln sind aber identisch. Gebiet wird gemacht, indem man auf dem Brett freie Schnittpunkte mit den eigenen Steinen vollständig abgrenzt. Im Bild hat Schwarz mit den Zügen 1, 3 und 7 begonnen, sich am oberen Rand des Brettes Gebiet abzugrenzen. Die weißen Züge 2 und 6 stellen den Versuch dar, Gebiet in der rechten unteren Ecke zu machen. Der schwarze Zug auf 5 soll es Weiß erschweren, am unteren Rand des Brettes Gebiet abzugrenzen.
Tobias Berben

Freiheiten und Steine fangen

Steine ohne Freiheiten sind gefangen und werden vom Brett genommen.

Das Abgrenzen von Gebiet wird dadurch erschwert, dass Steine gefangen werden können, indem man ihnen alle Freiheiten nimmt. Sind ein oder mehrere Steine vollständig von gegnerischen Steinen umzingelt, haben sie keine Freiheiten (freie, angrenzende Schnittpunkte) mehr und werden vom Brett genommen. Am Ende des Spiels zählen sowohl jeder abgegrenzte Gebietspunkt als auch jeder Gefangene einen Punkt. Gewonnen hat, wer in der Summe mehr Punkte hat. Im Diagramm haben alle schwarzen Steine keine Freiheiten mehr, sind damit gefangen und müssen vom Brett genommen werden.
Tobias Berben

Verbotene Züge - Ko und Selbstmord

1. Die Ko-Regel: Das direkte Zurückschlagen eines einzelnen Steines im nächsten Zug ist verboten.
2. Die Selbstmordregel: Selbstmord ist verboten.


1. Hat Weiß - wie im Diagramm - auf 1 gezogen, kann dieser Stein von Schwarz regulär mit 2 gefangen werden, da er nur eine Freiheit besitzt. Danach darf Weiß aber nicht mit 3 wiederum auf 1 setzen, um den schwarzen Stein auf 2 zu schlagen, der ebenfalls nur eine Freiheit besitzt. Wäre das erlaubt, könnte danach Schwarz wiederum mit 4 auf 2 den weißen Stein fangen, danach würde Weiß den schwarzen Stein schlagen usw. - das Spiel würde sich in einer sinnlosen Endlosschleife verfangen! Nachdem Schwarz mit 2 den weißen Stein 1 gefangen hat, muss Weiß daher zunächst mit 3 woanders auf dem Brett setzen.

2. Im Diagramm haben die schwarzen Steine in der rechten oberen Ecke nach einem schwarzen Zuge auf A keine Freiheit mehr, wären damit gefangen und müssten vom Brett genommen werden. Das wäre Selbstmord von Schwarz, da er den Verlust der eigenen Steine selbst bewirkt hat, was verboten ist. Gleiches gilt für den schwarzen Zug auf A rechts unten, der keine Freiheiten hätte. Ist allerdings B mit einem schwarzen Stein besetzt, würde der Zug auf A zugleich allen weißen Steinen die letzte Freiheit nehmen. Dann wäre dieser Zug kein Selbstmord mehr, da mit diesem Zug die weiße Steingruppe vom Brett genommen wird, wonach der schwarze Stein auf A drei Freiheiten hat.
Tobias Berben

Leben, Tod - und Seki

Gruppen von Steinen, die gefangen werden können, sind tot; Gruppen von Steinen, die nicht mehr gefangen werden können, sind lebendig.

Leben: Im Diagramm darf Weiß weder auf 'a' noch auf 'b' setzten, da beide Züge Selbstmord wären (vgl. Lektion 3: Die Selbstmordregel). Also kann die schwarze Gruppe von Weiß nicht mehr gefangen werden, da es Weiß nicht möglich ist, alle Freiheiten von Schwarz zu besetzen.

Tod: Die Gruppe in der linken oberen Ecke des Diagramms kann von Weiß noch gefangen werden. Zwar wäre ein Zug auf 'd' wiederum Selbstmord, nicht aber ein Zug auf 'c', da Weiß damit dem markierten schwarzen Stein die letzte Freiheit nimmt. Diesen schlagenden Stein von Weiß darf nun Schwarz nicht im nächsten Zug zurückschlagen (vgl. Lektion 3: Die Ko-Regel), weshalb Schwarz anderswo auf dem Brett ziehen muss. Dann aber darf Weiß auf 'd' setzen, da dieser Zug nun der schwarzen Steingruppe die letzte Freiheit nimmt.

Seki: In der Situation am unteren Rand handelt es sich um eine Koexistenz (Seki) - weder Schwarz noch Weiß wollen auf 'e' oder 'f' ziehen, da sie sich damit die vorletzte Freiheit nehmen würden, woraufhin der jeweils andere Spieler im darauffolgenden Zug durch das Nehmen der letzten Freiheit die Steine schlagen könnte. Da dies keiner von beiden Spielern will, wird in einer solchen Situation gar nicht mehr gezogen, wobei allerdings auch keiner der beiden Spieler in dieser Stellung Punkte macht.
Tobias Berben

Ende und Auszählen

Eine Partie ist beendet, wenn beide Spieler nicht mehr ziehen wollen. Wer dann mehr Punkte als der andere hat, der hat die Partei gewonnen.

Im Diagramm hat sich Weiß die obere Bretthälfte abgesteckt und Schwarz die untere. Beide glauben nicht mehr, dass sie noch in das Gebiet des jeweils anderen setzen können, ohne gefangen zu werden. Also ist die Partie beendet und es wird gezählt: Schwarz hat 31 leere Schnittpunkte abgegrenzt, Weiß hat 29 leere Schnittpunkte abgegrenzt, beide haben keine Steine des anderen gefangen. Somit gewinnt Schwarz mit 2 Punkten.
Tobias Berben

AlphaGo ist eine Entwicklung der Google-Tochter Deepmind und basiert auf künstlichen neuronalen Netzwerken. Sie lernen beständig weiter und werden so immer besser in ihren Aufgaben. Der Computer hatte im Oktober schon überraschend den dreifachen Go-Europameister Fan Hui bezwungen. Beobachter hatten geglaubt, ein solcher Go-Sieg der Maschine liege noch Jahre in der Zukunft. Nun gewann die Google-Software aber auch noch ihr erstes Match gegen Lee, der als besserer Spieler gilt.

Auf Twitter jubelte Deepmind-Gründer Demis Hassabis über den Sieg der Software, die seine Firma geschaffen und trainiert hat.

Beim Go-Spiel müssen die Spieler versuchen, die gegnerischen Steine zu umzingeln und wegzunehmen (siehe Fotostrecke). Wer die meisten Felder erobert hat, hat gewonnen. Im Schach werden schon lange Computer eingesetzt. Deep Blue von IBM schlug 1997 den Weltmeister Garri Kasparow.

Das Duell zwischen Lee und AlphaGo endet am 15. März. Der Gewinner bekommt eine Million Dollar (900.000 Euro).


Update, 14.40 Uhr: Lee Sedol hat sich nach seiner Niederlage überrascht gezeigt. "Ich habe nicht erwartet, zu verlieren, selbst als ich zu Beginn Mühe hatte", sagte Lee am Mittwoch. Es habe ihn erstaunt, wie perfekt AlphaGo spiele. Andrew Jackson vom amerikanischen Go-Verband hatte ebenfalls nicht mit einer Niederlage Lees gerechnet. "Wir haben gesagt, der Tag wird kommen", zitiert ihn die Nachrichtenagentur dpa. Doch habe man nicht geglaubt, dass dieser Moment schon so schnell eintreffen werde. "Wir sind vollkommen im Schockzustand."

Neuronale Netzwerke: Die Geschichte
Neuronales Netz: Knoten und gewichtete Verbindungen
David E. Rumelhart/ James L. McClelland

Neuronales Netz: Knoten und gewichtete Verbindungen

Die Idee, dass man die Morphologie des menschlichen Nervensystems nachbilden könnte, um Maschinen so etwas wie denken, lernen oder Wahrnehmung beizubringen, stammt schon aus den Vierzigerjahren des vergangenen Jahrhunderts. Lange Zeit aber blieben die sogenannten neuronalen Netzwerkmodelle eher rudimentär, ein Gebiet für Spezialisten mit besonderer Liebe zur Abstraktion. Dann, in der ersten Hälfte der Achtzigerjahre, änderte sich das vor allem dank einer einzigen Studie. Die Psychologen David Rumelhart und James McClelland zeigten, dass so ein extrem rudimentäres Pseudogehirn lernen kann, die Vergangenheitsformen englischer Verben korrekt zu bilden - und im Laufe des Lernprozesses vorübergehend die gleichen Fehler macht wie ein menschliches Kind beim gleichen Vorgang. Statt "went" warf das Netz als Antwort vorübergehend "goed" aus - es wendete also die Regel korrekt an, aber eben bei einem unregelmäßigen Verb.

Das Netzwerk lernte also Regeln und anschließend auch die Ausnahmen von diesen Regeln - ohne dass eine einzige Regel jemals explizit formuliert worden wäre. Die Studie löste in den Kognitionswissenschaften einen kleinen Boom aus, plötzlich wurden neuronale Netzwerkmodelle auf alle möglichen Fragestellungen angewendet, der Begriff "Konnektionismus" für die neue Wissenschaft kam auf. Dann kam das Internet, die digitale Revolution nahm ihren Lauf, und plötzlich gab es Rechenleistung und entsprechende Computer in Hülle und Fülle. Heute sind neuronale Netzwerke nicht mehr nur Modelle für Psychologen - sie sind zu mächtigen Werkzeugen in den Händen jener geworden, die Computern das Sehen, Denken, Deuten beibringen wollen.

Das Grundprinzip, nach dem solche neuronalen Netzwerke funktionieren, ist immer das gleiche. Sie bestehen aus zwei oder mehr Schichten von Knoten, simulierten Nervenzellen. Verbunden werden diese Schichten mit vielen Verknüpfungen. In der Regel ist jeder Knoten der einen Schicht mit allen Knoten der nächsten verbunden. Die Input-Knoten stehen für elementare Merkmale, sie könnten beispielsweise die Pixel eines vorgegebenen Bildes repräsentieren.

Wird ein Input-Knoten aktiviert, reichte er diese Aktivierung über seine Verbindungen an die Knoten der nächsten Schicht weiter. Die Verbindungen wurden gewichtet - man kann sie sich als unterschiedlich dick vorstellen. Je dicker die Verbindung, desto stärker die Aktivierung, die am nächsten Knoten ankommt. Belehrt wird so ein Netzwerk gewissermaßen rückwärts: Wenn die Output-Schicht nicht das gewünschte Ergebnis produziert, werden die Gewichtungen der Verbindungen mithilfe eines mathematischen Mechanismus Schicht für Schicht so angepasst, dass das Ergebnis beim nächsten Mal besser zum tatsächlichen Input passt. Mit vielen Durchgängen können die Netze so lernen, Inputs korrekt mit Outputs zu verknüpfen.

cis

AFP/gru



Forum - Diskutieren Sie über diesen Artikel
insgesamt 87 Beiträge
Alle Kommentare öffnen
Seite 1
05322 09.03.2016
1. Ki
Zu dem Unfug, es gebe eine künstliche Intelligenz. Wer schreibt eigentlich die Programme, die Maschinen zum Lernen und weiter Lernen befähigen? Ein Mensch oder eine außermenschliche Intelligenz?
furanku 09.03.2016
2.
Zitat von 05322Zu dem Unfug, es gebe eine künstliche Intelligenz. Wer schreibt eigentlich die Programme, die Maschinen zum Lernen und weiter Lernen befähigen? Ein Mensch oder eine außermenschliche Intelligenz?
Computer sind schon lange sowihl an der Hard- als auch Softwareentwicklung beteiligt. Die Fortschritte bei einer Generation der Chipentwicklung stehen unmittelbar bei der Entwicklung der nächsten zu Verfügung. Oder lauben Sie etwa Menschen könnten noch die Milliarden Transistoren einer CPU von Hand plazieren und optimieren? Selbst in der Mathenatik gibt es mittlerweile Computerbeweise und spezielle Systeme dafür.
multi_io 09.03.2016
3.
Zitat von 05322Zu dem Unfug, es gebe eine künstliche Intelligenz. Wer schreibt eigentlich die Programme, die Maschinen zum Lernen und weiter Lernen befähigen? Ein Mensch oder eine außermenschliche Intelligenz?
Ein Mensch. Und?
benji_86 09.03.2016
4.
@05322: Sehr skurrile Argumentation. Und falsch. Denn dann wäre Kunst im Allgemeinen keine Kunst, schließlich ist sie vom Menschen gemacht (und künstliche Befruchtung nicht künstlich, denn auch sie wird von einem Menschen durchgeführt etc etc...)
JBond 09.03.2016
5. vom Menschen gemacht = künstlich
Zitat von 05322Zu dem Unfug, es gebe eine künstliche Intelligenz. Wer schreibt eigentlich die Programme, die Maschinen zum Lernen und weiter Lernen befähigen? Ein Mensch oder eine außermenschliche Intelligenz?
Ja - der Mensch hat die "Programme" geschrieben...genau das macht es ja zu einer "künstlichen" Intelligenz (je nachdem, wie man den Begriff "intelligent" definiert). Oder ist ein Auto ein "natürliches" Fortbewegungsmittel. Glückwunsch an die Deepmind-Entwickler...mal schauen, ob der Champion morgen noch ein paar Asse im Ärmel hat.
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2016
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.