
Poker: Wenn der Computer blufft
Texas Hold'em Computer schlägt erstmals Menschen beim Poker
Bluffen, alle Chips setzen, Millionen gewinnen - Poker fasziniert Spieler, Zuschauer und Filmhelden wie James Bond gleichermaßen. Dank Internet kann man jederzeit einsteigen, egal ob dabei um echtes Geld oder nur zum Spaß gespielt wird.
Nun haben Forscher der University of Alberta in Kanada eine Software entwickelt, gegen die selbst Profi-Pokerspieler keine Chance mehr haben. Alle bisherigen Versuche, das Pokerspiel mit Computern zu knacken, waren gescheitert. Über ihr Programm berichten Mike Bowling und seine Kollegen im Fachblatt "Science" .
Poker gehört zu den Spielen mit imperfekter Information. Anders als etwa bei Schach, wo alle Figuren offen sichtbar auf dem Feld stehen, hat ein Spieler nicht die vollständigen Informationen über das Geschehen. Er weiß nämlich nicht, welche Karten sein Gegenüber hat. Er kennt nur seine eigenen und kann allerhöchstens aus den Spielaktionen seines Gegners gewisse Rückschlüsse auf dessen Blatt ziehen. Dieses unvollständige Wissen macht eine Lösung des Pokerspiels mit Computern auch so schwierig.
"Seit mehr als 40 Jahren war Poker eine Herausforderung für Künstliche Intelligenz", sagt Bowling. Nun habe man es erstmals für eine spezielle Variante lösen können, das sogenannte Heads-up Limit Texas Hold'em. Dabei spielen zwei Personen gegeneinander. Zusätzlich ist die Zahl der Einsätze und ihre Höhe begrenzt.
Computer spielt immer wieder gegen sich selbst
Texas Hold'em gehört zu den polulärsten Pokervarianten. Jeder Spieler bekommt zwei Karten aus einem Deck mit 52 Blatt. Auf dem Tisch liegen bis zu fünf Karten offen sichtbar, die mit verwendet werden dürfen. Spieler können Chips setzen. Man gewinnt entweder, weil man das beste Blatt hat, oder weil kein Gegner beim Setzen mitgehen will.
Bei der Variante Heads-up Limit Texas Hold'em gebe es 3,16 * 1017 mögliche Spielsituationen, schreiben die Forscher der University of Alberta. Um den für jede Situation optimalen Spielzug zu finden, nutzten sie einen intelligenten Brute-Force-Ansatz. Der Computer habe immer wieder gegen sich selbst gespielt, anfangs waren die Aktionen zufällig, berichtet Neil Burch von der University of Alberta, der an der Studie beteiligt war.
Dann habe die Software begonnen, den Erfolg der Schritte zu bewerten, und so die Strategie immer mehr verbessert. Dies sei immer und immer wieder wiederholt worden, bis der Computer schließlich die für jede Spielsituation optimale Aktion gefunden habe. Die Berechnung auf einem Parallelcomputer mit 200 2,1-GHz-Prozessoren dauerte fast 70 Tage. Ihr Ergebnis ist eine 11 Terabyte große Datei, in der die für jede Spielsituation beste Aktion gespeichert ist. Wer will, kann via Internet gegen das Programm spielen .
Zufallsgenerator hilft beim Pokern
Das Programm blufft sogar wie ein echter Profi. Denn in vielen Situationen gibt es nicht die eine optimale Aktion, welche die größten Erfolgschancen verspricht. Stattdessen sind mehrere Optionen möglich. Beispielsweise kann Mitgehen in 75 Prozent der Spielsituationen das Beste sein, und Aussteigen in 25 Prozent.
"Der Computer muss sich zwischen diesen beiden Möglichkeiten entscheiden", erklärt Burch - und das geschehe per Zufallsgenerator. In drei Viertel der Fälle gehe der Computer mit, in einem Viertel der Fälle steige er aus. Weil die Entscheidung darüber zufällig ist, handelt der Computer im wahrsten Sinne des Wortes unberechenbar. Er wird selbst mit einem schlechten Blatt immer mal wieder mitgehen, weil auch bei einem schlechten Blatt Gewinnchancen bestehen.
Unbesiegbar ist das Programm freilich nicht. Bei schlechten Karten verliert es die Runde genauso wie ein Spieler aus Fleisch und Blut. Wird das Spiel aber sehr häufig wiederholt, wodurch sich das Kartenglück gleichmäßig über alle Spieler verteilt, ist die Software nach Aussagen der Forscher unbesiegbar. Dies habe ein Testlauf mit mehr als 60 Millionen Spielen bewiesen.
Um aber bei großen Turnieren oder der Pokerweltmeisterschaft antreten zu können, müssten die Forscher ihre Software enorm erweitern. Denn dabei sitzen bis zu zehn Spieler an einem Tisch, je nach Variante wird auch ohne Limit gespielt. Dies erhöht die Zahl der Spielsituationen und damit den Rechenaufwand dramatisch.
Aber selbst wenn es gelänge, Poker allgemein am Computer zu lösen, würde dies noch lange nicht bedeuten, dass die Software automatisch jedes Turnier gewinnt. Wegen der vergleichsweise kleinen Zahl von Spielen bei Turnieren dürfte letztendlich das Kartenglück darüber entscheiden, wer gewinnt, und nicht ein an sich perfekter Algorithmus.