Geschichte der Schachprogramme: Fritz und die Papiermaschine
Geschichte der Schachprogramme Kampf der Superrechner

Frederic Friedel, 76, studierte Philosophie, Wissenschaftstheorie und Linguistik in Hamburg und Oxford. Als Wissenschaftsjournalist beschäftigte er sich für ZDF und ARD schon in den Siebzigern mit Computerschach. 1987 gründete Friedel zusammen mit Matthias Wüllenweber das Unternehmen ChessBase, das heute weltweit zu den größten Anbietern von Schachsoftware gehört und auch Kooperationspartner des SPIEGEL war. Friedel lebt in Hamburg.
Das ist der dritte Teil der Serie über Computerschach von ChessBase-Gründer Frederic Friedel. Den ersten Teil finden Sie hier. Den zweiten unter diesem Link.
Es war Mitte der Neunziger. Ich war in London, und wie so oft begleitete ich Schachweltmeister Garri Kasparow bei einem seiner Auftritte. Dieses Mal ins Home House, eine wunderbare georgianische Villa in Marylebone, wo wir beim Abendessen ein ehemaliges Schachwunderkind trafen. Er hatte im Alter von 13 Jahren Meisterstärke (Elo 2300+) erreicht und war Kapitän einer Reihe von englischen Jugendteams gewesen. Außerdem war er bei Computerspielen Weltklasse. Die Begegnung war interessant, und der junge Bursche sprach voller Begeisterung über ein Spiel, das er gerade entwickelte. Nachdem er gegangen war, sagte ich zu Garri: "Ein ziemlich frecher junger Mann!" "Aber sehr klug", entgegnete Garri. Dabei beließen wir es.
20 Jahre später las ich in den Nachrichten, dass Google ein Unternehmen namens Deepmind Technologies für 400 Millionen britische Pfund gekauft hatte. Deepmind arbeitete im Bereich künstlicher Intelligenz und hatte Software für ein neuronales Netz entwickelt, das ganz allein gelernt hatte, wie man Videospiele der ersten Generation wie Pong und Space Invaders spielte. Das Programm wurde dabei nicht von Hand programmiert, sondern benutzte Methoden, die denen sehr nahe kamen, mit denen Menschen in einem Spiel besser wurden. Ziel war es, so hatte Deepmind erklärt, "eine universelle KI zu entwickeln, die für fast alles nützlich und effektiv ist".
Go als Basis für den stärksten Schachcomputer der Welt
Einer der Gründer des Unternehmens war Demis Hassabis, den wir im Home House getroffen hatten. Ein Jahr lang verfolgte ich die Fortschritte, die das Unternehmen als Mitglied der Google-Familie machte, und war besonders davon fasziniert, wie sie ein Problem lösen konnten, an dem Computerexperten Jahrzehnte lang gescheitert waren: Mit Alpha Go hatte Deepmind ein Programm entwickelt, das gelernt hatte, wie man das alte japanische Brettspiel Go spielt, und es zu Meisterstärke und dann auf Weltmeisterniveau gebracht hatte.
Die Go-Regeln sind trügerisch einfach, aber die vielen Möglichkeiten machen es Computern sehr schwer, das Spiel zu berechnen. Im zweiten Artikel meiner Serie habe ich beschrieben, wie es in einer 40-zügigen Partie Schach 10128 mögliche Zugfolgen gibt - sehr viel mehr als die Zahl von Atomen im Universum. Beim Go gibt es 10170 mögliche Konstellationen auf dem Brett. Dagegen wirkt die Zahl möglicher Schachpartien unbedeutend.

AlphaGo
Foto: Ahn Young-joon/ APDas Programm nutzte tiefe neuronale Netze, um eine sehr große Zahl von Partien zu untersuchen und ein eigenes Verständnis davon zu entwickeln, wie menschliches Spiel aussieht. Im Anschluss entwickelte das Programm sein Können weiter, indem es in verschiedenen Versionen gegen sich selbst spielte und dabei aus seinen Fehlern lernte. Dieser Prozess, der als "Reinforcement Learning", als "verstärkendes Lernen", bekannt ist, führte zu einer Software, die Go auf Meisterniveau spielt.
Mehr als 20 Jahre nach ihrer ersten Begegnung diskutiert Garri Kasparow mit Demis Hassabis über künstliche Intelligenz.
Zu dieser Zeit arbeitete Hassabis bereits an der Entwicklung einer Schach-Engine, die anders war als alle vorherigen. Traditionelle Engines bekommen ihr Wissen über das Schach einprogrammiert. Das neuronale Netz von Deepmind ging einen radikal anderen Weg: Man zeigte ihm die Regeln des Schachs, wie die Figuren ziehen und das Ziel des Spiels, das Mattsetzen. Sonst nichts. Mithilfe der modernsten Techniken künstlicher Intelligenz spielte das Programm, Alpha Zero, gegen sich selbst, millionenfach, erkannte dabei selbstständig Muster und passte deren Bewertungen nach eigenem Ermessen entsprechend an.
Computer spielt 44 Millionen Partien gegen sich selbst
Wie war das möglich? Am Anfang spielte das System absurde Partien, in denen eine Seite drei Figuren für nichts opferte, aber die andere Seite nicht gewinnen konnte, weil sie vier Figuren verloren hatte. Aber mit jedem Durchlauf, nach 10.000 Lernschritten, wurde Alpha Zero stärker. Es spielte 44 Millionen Partien gegen sich selbst und kam im Schach dabei auf Weltklasseniveau.
Niemand hatte Alpha Zero irgendetwas über Strategie erzählt, niemand hatte erklärt, dass Material wichtig war, dass Damen wertvoller sind als Läufer, dass Beweglichkeit eine Rolle spielt. Das Programm hatte alles alleine herausgefunden und seine eigenen Schlüsse gezogen - Schlüsse, die ein Mensch übrigens nie verstehen wird. Am Ende spielte Alpha Zero ein Testmatch gegen eine Open-Source-Engine namens Stockfish, eine der drei oder vier stärksten traditionellen Engines der Welt.
Diese Engines kommen alle auf eine Spielstärke von etwa 3500 Punkten auf der Wertungsskala, und haben damit mindestens 700 Punkte mehr als jeder Mensch. Stockfish berechnete 70 Millionen Stellungen pro Sekunde; Alpha Zero gerade einmal 80.000. Es kompensierte diesen tausendfachen Nachteil, indem es nur nach den aussichtsreichsten Varianten suchte - Züge, die sich beim Spiel gegen sich selbst in ähnlichen Stellungen als besonders effektiv erwiesen hatten.
Alle Partien ohne Eröffnungsbuch
Von den 100 Partien gegen Stockfish gewann Alpha Zero 25 mit Weiß, drei mit Schwarz und spielte die restlichen 72 Remis. Alle Partien wurden ohne Zugriff auf ein Eröffnungsbuch gespielt. Zusätzlich wurde eine Serie von zwölf Wettkämpfen über 100 Partien ausgetragen, mit zwölf der bei Menschen beliebtesten Eröffnungen als Ausgangsstellung. Alpha Zero gewann 290, remisierte 886 und verlor 24 Partien.
Aber das ist nicht alles. Die von Deepmind benutzten Techniken lassen sich nicht nur auf das Schach anwenden. Man kann neuronale Netze nutzen, um alles mögliche zu lernen - Bilder, Gesichter oder Handschriften erkennen; Sprache maschinell verarbeiten; Bewegung berechnen (für Computerspiele oder Roboter); Wirtschaft und Börsen verstehen und bessere Prognosen abgeben als menschliche Experten.
Die jungen Programmierer wollen verstehen, wie sich ihr Gebiet verändert, wie sich gegenwärtig der Übergang von minutiöser Hand-Programmierung zu unbeaufsichtigtem Lernen durch Computer vollzieht, und in welchen Bereichen diese Methode überlegen ist. Alpha Zero ist lediglich ein früher Beweis dafür. Und wir müssen davon ausgehen, dass dies nicht nur für Go und Schach der Fall sein wird, sondern für viele Bereiche unseres Lebens. Das ist die Zukunft der Menschheit, und es wäre gut, wenn wir uns frühzeitig darauf einstellen.
Wir haben die Anzahl möglicher Zugfolgen in einer 40-zügigen Partie korrigiert.