Brettspielduell Computer siegt erneut gegen Go-Genie

Zwei Partien, zwei Gewinne: Der Computer AlphaGo von Google hat erneut gegen Lee Sedol gewonnen. Beobachter sind von der Spielstärke des Programms überrascht.

Go-Steine
hebsacker-verlag.de

Go-Steine


AlphaGo vs. Lee Sedol
  • Corbis
    Der wohl weltbeste Go-Profi Lee Sedol spielt fünf Partien gegen die Deepmind-Software AlphaGo. Ausgetragen werden die Partien am 9., 10., 12., 13. und 15. März im Four Seasons Hotel in Seoul, Südkorea. Die Partien beginnen jeweils um fünf Uhr morgens deutscher Zeit und werden bei YouTube als Livestream übertragen.
Der Computer ist nicht zu schlagen: Auch in der zweiten Runde des Go-Brettspielduells zwischen dem Computers AlphaGo und Weltmeister Lee Sedol hat die Maschine den Sieg errungen. Die zweite Partie hatte einen Tag nach dem nicht nur für Lee überraschenden Sieg des Computers begonnen. Das Programm AlphaGo machte am Donnerstag mit den schwarzen Steinen den ersten Zug und spielte sich in viereinhalb Stunden wieder zum Gewinn.

Am Mittwoch in der ersten Partie hatte Lee sich nach dreieinhalb Stunden für geschlagen erklärt, da er keine Siegeschancen mehr sah. Damit hatte er relativ schnell aufgegeben, Titelmatches können sich auch über fünf oder sechs Stunden ziehen. Insgesamt geht das Duell in der südkoreanischen Hauptstadt Seoul über fünf Partien.

Go ist ein traditionsreiches asiatisches Brettspiel, es ist noch weit komplizierter als Schach und gilt für die Künstliche Intelligenz als besonders schwer zu knacken. Hier könnte die Menschheit ihre Überlegenheit vor lernenden Maschinen noch ein paar Jahre verteidigen, glaubten manche.

"AlphaGo hat wundervolle, kreative Züge gespielt"

Lee - der 18 internationale Titel gewann - hatte sich deswegen vor Beginn des Duells siegessicher gezeigt: Er werde haushoch gewinnen, hatte der 33-Jährige noch im Februar angekündigt. Diese Selbstsicherheit dürfte nach der zweiten Niederlage gegen den Computer nun weg sein. "Ich habe nicht erwartet, zu verlieren, selbst als ich zu Beginn Mühe hatte", sagte Lee am Mittwoch, nach der ersten Partie. Die zweite Niederlage kommentierte er mit den Worten: "Ich bin sprachlos".

Spielmaterial und Ziel

Go wird auf einem Brett von 19x19-Linien mit schwarzen und weißen Spielsteinen gespielt. Es wird immer abwechselnd auf die Schnittpunkte des Brettes gesetzt, wobei Schwarz beginnt. Ziel des Spieles ist es, mehr Gebiet zu machen als der andere Spieler.

Anfänger spielen meist auf einem 13x13- oder einem 9x9-Brett (siehe Diagramm), um das Spiel während der Lernphase einfacher und übersichtlicher zu halten, die Regeln sind aber identisch. Gebiet wird gemacht, indem man auf dem Brett freie Schnittpunkte mit den eigenen Steinen vollständig abgrenzt. Im Bild hat Schwarz mit den Zügen 1, 3 und 7 begonnen, sich am oberen Rand des Brettes Gebiet abzugrenzen. Die weißen Züge 2 und 6 stellen den Versuch dar, Gebiet in der rechten unteren Ecke zu machen. Der schwarze Zug auf 5 soll es Weiß erschweren, am unteren Rand des Brettes Gebiet abzugrenzen.
Tobias Berben

Freiheiten und Steine fangen

Steine ohne Freiheiten sind gefangen und werden vom Brett genommen.

Das Abgrenzen von Gebiet wird dadurch erschwert, dass Steine gefangen werden können, indem man ihnen alle Freiheiten nimmt. Sind ein oder mehrere Steine vollständig von gegnerischen Steinen umzingelt, haben sie keine Freiheiten (freie, angrenzende Schnittpunkte) mehr und werden vom Brett genommen. Am Ende des Spiels zählen sowohl jeder abgegrenzte Gebietspunkt als auch jeder Gefangene einen Punkt. Gewonnen hat, wer in der Summe mehr Punkte hat. Im Diagramm haben alle schwarzen Steine keine Freiheiten mehr, sind damit gefangen und müssen vom Brett genommen werden.
Tobias Berben

Verbotene Züge - Ko und Selbstmord

1. Die Ko-Regel: Das direkte Zurückschlagen eines einzelnen Steines im nächsten Zug ist verboten.
2. Die Selbstmordregel: Selbstmord ist verboten.


1. Hat Weiß - wie im Diagramm - auf 1 gezogen, kann dieser Stein von Schwarz regulär mit 2 gefangen werden, da er nur eine Freiheit besitzt. Danach darf Weiß aber nicht mit 3 wiederum auf 1 setzen, um den schwarzen Stein auf 2 zu schlagen, der ebenfalls nur eine Freiheit besitzt. Wäre das erlaubt, könnte danach Schwarz wiederum mit 4 auf 2 den weißen Stein fangen, danach würde Weiß den schwarzen Stein schlagen usw. - das Spiel würde sich in einer sinnlosen Endlosschleife verfangen! Nachdem Schwarz mit 2 den weißen Stein 1 gefangen hat, muss Weiß daher zunächst mit 3 woanders auf dem Brett setzen.

2. Im Diagramm haben die schwarzen Steine in der rechten oberen Ecke nach einem schwarzen Zuge auf A keine Freiheit mehr, wären damit gefangen und müssten vom Brett genommen werden. Das wäre Selbstmord von Schwarz, da er den Verlust der eigenen Steine selbst bewirkt hat, was verboten ist. Gleiches gilt für den schwarzen Zug auf A rechts unten, der keine Freiheiten hätte. Ist allerdings B mit einem schwarzen Stein besetzt, würde der Zug auf A zugleich allen weißen Steinen die letzte Freiheit nehmen. Dann wäre dieser Zug kein Selbstmord mehr, da mit diesem Zug die weiße Steingruppe vom Brett genommen wird, wonach der schwarze Stein auf A drei Freiheiten hat.
Tobias Berben

Leben, Tod - und Seki

Gruppen von Steinen, die gefangen werden können, sind tot; Gruppen von Steinen, die nicht mehr gefangen werden können, sind lebendig.

Leben: Im Diagramm darf Weiß weder auf 'a' noch auf 'b' setzten, da beide Züge Selbstmord wären (vgl. Lektion 3: Die Selbstmordregel). Also kann die schwarze Gruppe von Weiß nicht mehr gefangen werden, da es Weiß nicht möglich ist, alle Freiheiten von Schwarz zu besetzen.

Tod: Die Gruppe in der linken oberen Ecke des Diagramms kann von Weiß noch gefangen werden. Zwar wäre ein Zug auf 'd' wiederum Selbstmord, nicht aber ein Zug auf 'c', da Weiß damit dem markierten schwarzen Stein die letzte Freiheit nimmt. Diesen schlagenden Stein von Weiß darf nun Schwarz nicht im nächsten Zug zurückschlagen (vgl. Lektion 3: Die Ko-Regel), weshalb Schwarz anderswo auf dem Brett ziehen muss. Dann aber darf Weiß auf 'd' setzen, da dieser Zug nun der schwarzen Steingruppe die letzte Freiheit nimmt.

Seki: In der Situation am unteren Rand handelt es sich um eine Koexistenz (Seki) - weder Schwarz noch Weiß wollen auf 'e' oder 'f' ziehen, da sie sich damit die vorletzte Freiheit nehmen würden, woraufhin der jeweils andere Spieler im darauffolgenden Zug durch das Nehmen der letzten Freiheit die Steine schlagen könnte. Da dies keiner von beiden Spielern will, wird in einer solchen Situation gar nicht mehr gezogen, wobei allerdings auch keiner der beiden Spieler in dieser Stellung Punkte macht.
Tobias Berben

Ende und Auszählen

Eine Partie ist beendet, wenn beide Spieler nicht mehr ziehen wollen. Wer dann mehr Punkte als der andere hat, der hat die Partei gewonnen.

Im Diagramm hat sich Weiß die obere Bretthälfte abgesteckt und Schwarz die untere. Beide glauben nicht mehr, dass sie noch in das Gebiet des jeweils anderen setzen können, ohne gefangen zu werden. Also ist die Partie beendet und es wird gezählt: Schwarz hat 31 leere Schnittpunkte abgegrenzt, Weiß hat 29 leere Schnittpunkte abgegrenzt, beide haben keine Steine des anderen gefangen. Somit gewinnt Schwarz mit 2 Punkten.
Tobias Berben

AlphaGo ist eine Entwicklung der Google-Tochter Deepmind und basiert auf künstlichen neuronalen Netzwerken. Sie lernen beständig weiter und werden so immer besser in ihren Aufgaben. Der Computer hatte im Oktober schon überraschend den dreifachen Go-Europameister Fan Hui bezwungen. Beobachter hatten geglaubt, ein solcher Go-Sieg der Maschine liege noch Jahre in der Zukunft. Nun gewann die Google-Software aber schon zwei von zwei Matches gegen Lee, der als besserer Spieler gilt.

Auf Twitter freute Deepmind-Gründer Demis Hassabis über Sieg Nummer zwei der Software, die seine Firma geschaffen und trainiert hat. "AlphaGo hat wundervolle, kreative Züge gespielt in diesem Spiel", schwärmt Hassabis.

Beim Go-Spiel müssen die Spieler versuchen, die gegnerischen Steine zu umzingeln und wegzunehmen (siehe Fotostrecke). Wer die meisten Felder erobert hat, hat gewonnen. Im Schach werden schon lange Computer eingesetzt. Deep Blue von IBM schlug 1997 den Weltmeister Garri Kasparow.

Das Duell zwischen Lee und AlphaGo endet am 15. März. Der Gewinner bekommt eine Million Dollar (900.000 Euro). Deepmind hat angekündigt, das Preisgeld für wohltätige Zwecke zu spenden, sollte AlphaGo als Sieger aus dem Turnier hervorgehen.

Neuronale Netzwerke: Die Geschichte
Neuronales Netz: Knoten und gewichtete Verbindungen
David E. Rumelhart/ James L. McClelland

Neuronales Netz: Knoten und gewichtete Verbindungen

Die Idee, dass man die Morphologie des menschlichen Nervensystems nachbilden könnte, um Maschinen so etwas wie denken, lernen oder Wahrnehmung beizubringen, stammt schon aus den Vierzigerjahren des vergangenen Jahrhunderts. Lange Zeit aber blieben die sogenannten neuronalen Netzwerkmodelle eher rudimentär, ein Gebiet für Spezialisten mit besonderer Liebe zur Abstraktion. Dann, in der ersten Hälfte der Achtzigerjahre, änderte sich das vor allem dank einer einzigen Studie. Die Psychologen David Rumelhart und James McClelland zeigten, dass so ein extrem rudimentäres Pseudogehirn lernen kann, die Vergangenheitsformen englischer Verben korrekt zu bilden - und im Laufe des Lernprozesses vorübergehend die gleichen Fehler macht wie ein menschliches Kind beim gleichen Vorgang. Statt "went" warf das Netz als Antwort vorübergehend "goed" aus - es wendete also die Regel korrekt an, aber eben bei einem unregelmäßigen Verb.

Das Netzwerk lernte also Regeln und anschließend auch die Ausnahmen von diesen Regeln - ohne dass eine einzige Regel jemals explizit formuliert worden wäre. Die Studie löste in den Kognitionswissenschaften einen kleinen Boom aus, plötzlich wurden neuronale Netzwerkmodelle auf alle möglichen Fragestellungen angewendet, der Begriff "Konnektionismus" für die neue Wissenschaft kam auf. Dann kam das Internet, die digitale Revolution nahm ihren Lauf, und plötzlich gab es Rechenleistung und entsprechende Computer in Hülle und Fülle. Heute sind neuronale Netzwerke nicht mehr nur Modelle für Psychologen - sie sind zu mächtigen Werkzeugen in den Händen jener geworden, die Computern das Sehen, Denken, Deuten beibringen wollen.

Das Grundprinzip, nach dem solche neuronalen Netzwerke funktionieren, ist immer das gleiche. Sie bestehen aus zwei oder mehr Schichten von Knoten, simulierten Nervenzellen. Verbunden werden diese Schichten mit vielen Verknüpfungen. In der Regel ist jeder Knoten der einen Schicht mit allen Knoten der nächsten verbunden. Die Input-Knoten stehen für elementare Merkmale, sie könnten beispielsweise die Pixel eines vorgegebenen Bildes repräsentieren.

Wird ein Input-Knoten aktiviert, reichte er diese Aktivierung über seine Verbindungen an die Knoten der nächsten Schicht weiter. Die Verbindungen wurden gewichtet - man kann sie sich als unterschiedlich dick vorstellen. Je dicker die Verbindung, desto stärker die Aktivierung, die am nächsten Knoten ankommt. Belehrt wird so ein Netzwerk gewissermaßen rückwärts: Wenn die Output-Schicht nicht das gewünschte Ergebnis produziert, werden die Gewichtungen der Verbindungen mithilfe eines mathematischen Mechanismus Schicht für Schicht so angepasst, dass das Ergebnis beim nächsten Mal besser zum tatsächlichen Input passt. Mit vielen Durchgängen können die Netze so lernen, Inputs korrekt mit Outputs zu verknüpfen.

cis

gru/dpa



Forum - Diskutieren Sie über diesen Artikel
insgesamt 139 Beiträge
Alle Kommentare öffnen
Seite 1
zyndstoff 10.03.2016
1. Immer noch nicht Weltmeister...
Der Koreaner Lee Sedol ist immer noch nicht "Weltmeister im Go" (wie ich schon gestern kommentierte), weil es keine Go-Weltmeisterschaften gibt. Die Artikelschreiber des Spiegel zeigen sich beratungsresistent, aber zumindest standfest.
querulant_99 10.03.2016
2.
Zitat SPON: Das Duell zwischen Lee und AlphaGo endet am 15. März. Der Gewinner bekommt eine Million Dollar (900.000 Euro). Da wird sich AlphaGo mächtig über die 900.000 $ freuen und Freudensprünge auf den Spieltisch machen ohne Rücksicht auf das Wohlergehen seiner Festplatte. ;-)
pauleschnueter 10.03.2016
3. GO ist so einfach, dass sogar Computer gewinnen können!
"AlphaGo hat wundervolle, kreative Züge gespielt" Na offensichtlich ja nicht, da es ein Computer ist. Anders herum kann man auch folgern, dass GO so einfach ist, dass sogar Computer gewinnen können. Die "Kreativität" ist eben das, was der menschliche Geist zu erahnen vermeint ... und das ist wiederum die Leistung des menschlichen GO-Experten. Kann denn die Maschine beurteilen, welche Züge "kreativ" sind und welche nicht? ich vermute nein.
alex300 10.03.2016
4. Im Denkspiel mit einem Rechner messen?
Das wäre ungefähr so, als wenn ein Gewichtheber gegen einen Baukran antreten würde.
wdiwdi 10.03.2016
5. Wird gespendet
Zitat von querulant_99Zitat SPON: Das Duell zwischen Lee und AlphaGo endet am 15. März. Der Gewinner bekommt eine Million Dollar (900.000 Euro). Da wird sich AlphaGo mächtig über die 900.000 $ freuen und Freudensprünge auf den Spieltisch machen ohne Rücksicht auf das Wohlergehen seiner Festplatte. ;-)
Sollte AlphaGo gewinnen, geht das Preisgeld an karitative Organisationen.
Alle Kommentare öffnen
Seite 1

© SPIEGEL ONLINE 2016
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung der SPIEGELnet GmbH


TOP
Die Homepage wurde aktualisiert. Jetzt aufrufen.
Hinweis nicht mehr anzeigen.