SPIEGEL ONLINE

SPIEGEL ONLINE

12. Juli 2019, 15:18 Uhr

Künstliche Intelligenz "Pluribus"

Poker-Software besiegt fünf Profispieler

Kein Bluff: Eine Software von Forschern der Carnegie Mellon University und von Facebook gewinnt Pokerpartien - sogar im Spiel gegen fünf Profis.

Geradezu "übermenschlich" (engl. superhuman) soll es sein, das "Pluribus" genannte Pokerprogramm von Noam Brown und Tuomas Sandholm. Denn die selbstlernende Software hat es geschafft, Pokerpartien mit mehr als zwei Spielern öfter zu gewinnen als ihre menschlichen Gegner.

Genauer: Bei mehr als 10.000 gespielten Händen in der Poker-Variante "No Limit Texas Hold'em" mit insgesamt sechs Spielern gewann "Pluribus" häufiger als die Profispieler, gegen die das Programm antrat.

Die Wissenschaftler von der Carnegie Mellon University in Pittsburgh und von Facebook veröffentlichten die Ergebnisse in der Fachzeitschrift "Science" unter dem Titel "Superhuman AI for multiplayer poker" und bezeichneten ihren Erfolg als "Meilenstein" in der Entwicklung von künstlicher Intelligenz (KI).

"Pluribus" lernte das Pokern im Spiel gegen sich selbst

Bisherige Programme besiegten allenfalls einzelne Gegner beim Pokern - darunter die ebenfalls von Brown und Sandholm entwickelte Software "Libratus" sowie "DeepStack" von der University of Alberta im kanadischen Edmonton. Diese Poker-Variante mit nur zwei Spielern wird als "Heads-Up" bezeichnet. Schon das ist bemerkenswert, denn anders als Schach oder Go ist Poker erstens ein sogenanntes Spiel mit imperfekter Information: Jeder Spieler kennt nur die eigenen Karten. Zweitens können Spieler bluffen, was lange als zutiefst menschliche Fähigkeit angesehen wurde.

Nach Angaben der Forscher stellen Spiele mit mehr als zwei Teilnehmern noch einmal höhere Anforderungen an die Software, weshalb sie ihren Algorithmus so konstruierten, dass er die Komplexität der Spielsituation reduziert und dabei trotzdem erkennt, ob eine veränderte Strategie im Laufe der Partie erfolgsversprechender ist. Selbst Bluffen kann sie - ganz ohne Pokerface aus Fleisch und Blut. "Pluribus" spielt einfach immer komplett unberechenbar, wie die menschlichen Gegner feststellen mussten.

"Pluribus" wurde zunächst trainiert, indem es "No Limit Texas Hold'em" gegen Kopien von sich selbst spielte. Dabei entdeckte und entwickelte es ganz von allein Strategien. "In mancher Hinsicht spielt "Pluribus" so wie Menschen. Manchmal greift es jedoch auf komplett außerirdische Strategien zurück", sagte Sandholm.

Später ließen die Forscher die Software in zwei Varianten gegen Menschen antreten: In der ersten Variante spielte der Computer gegen fünf professionelle Pokerspieler. In der zweiten Variante spielte ein Mensch gegen fünf virtuelle Spieler. In beiden Konstellationen setzte sich der Computer signifikant öfter durch. Unter den geschlagenen Profis waren unter anderem der Rekord-Titelträger der World Poker Tour, Darren Elias, und der sechsfache Turniersieger der World Series of Poker, Chris Ferguson.

Der Code von "Pluribus" bleibt geheim

"Eine Partie mit sechs statt mit zwei Spielern zu spielen, erfordert grundlegende Veränderungen darin, wie die künstliche Intelligenz ihre Spielstrategie entwickelt", sagte Brown, der für Facebook arbeitet. "Von der Performance des Programms sind wir begeistert und wir denken, dass einige der Spielstrategien von "Pluribus" sogar das Spielverhalten der Profis ändern werden." Den Code von "Pluribus" haben sie aber nicht veröffentlicht.

Die Entwicklung der KI hat sich in den vergangenen Jahrzehnten immer wieder in spektakulären Wettkämpfen "Mensch gegen Computer" niedergeschlagen. Vor über 20 Jahren besiegte das Programm "Deep Blue" den früheren Schachweltmeister Garri Kasparow. Vor drei Jahren war eine Software erstmals beim traditionellen asiatischen Brettspiel Go überlegen. Und vor zwei Jahren dann siegten Computerprogramme für Pokerpartien mit nur zwei Spielern.

Die KI-Forschungen mit Spielen wie Schach, Go oder Poker dienen letztlich auch der Entwicklung von kommerziell verwertbaren Algorithmen, etwa in der Entwicklung von Medikamenten oder der idealen Strategie bei der Versteigerung von Mobilfunklizenzen. Sandholm denkt aber auch über den Einsatz zu militärischen Zwecken nach.

"Es ist natürlich eine schöne Umgebung, in der man leicht demonstrieren kann, dass man mit KI Fortschritte erzielt", sagte Andreas Hotho von der Universität Würzburg, der nicht an der Studie beteiligt war. Spiele seien letztlich aber eher ein Anwendungsgebiet von KI, die KI-Entwicklung laufe unabhängig von den sogenannten Games weiter. Bedeutend seien zum Beispiel die Verbesserung neuronaler Netze und des sogenannten Deep Learnings. Hierbei handelt es sich um Verfahren, bei denen Computer mithilfe von Algorithmen und großen Datenmengen das Lernen lernen.

"Die Arbeit ist solide und die Leistungen sind technisch sehr beeindruckend - vor allem, was die Rechenleistung und die Rechenzeit betrifft", sagte Andreas Holzinger vom Institut für Medizinische Informatik/Statistik an der Medizinischen Universität Graz über die Studie. "Aber es bringt wieder die Frage auf, ob künstliche Intelligenz tatsächlich mit menschlicher Intelligenz überhaupt vergleichbar ist oder sein kann und ob es gut ist, überhaupt von "superhuman' zu sprechen. Menschliche Intelligenz hat vielfältige Qualitäten - eben nicht nur in einer eng begrenzten Aufgabenstellung."

pbe/dpa

URL:

Verwandte Artikel:

Mehr im Internet


© SPIEGEL ONLINE 2019
Alle Rechte vorbehalten
Vervielfältigung nur mit Genehmigung