Stratego-Bluff-Test Künstliche Intelligenz trickst nun sogar besser als Menschen

Im Schach sind Computer Menschen längst überlegen. Doch beim Bluffen hatte künstliche Intelligenz fast immer das Nachsehen – bis jetzt.
Stratego: Die KI entschied 84 Prozent der Partien für sich

Stratego: Die KI entschied 84 Prozent der Partien für sich

Foto: Michael Schick / IMAGO

Algorithmen haben den Schachsport schon vor Jahren entzaubert. 1996 besiegte der Schachcomputer »Deep Blue« Schachweltmeister Garri Kasparov. Seitdem sollten sich selbst Schachchampions vergewissern, dass sie gegen einen Gegner aus Fleisch und Blut spielen, wie die Betrugsvorwürfe gegen Schachstar Hans Niemann zeigen.

In vielen Punkten blieben Menschen aber weiterhin die besseren Spieler. Sie können besser bluffen, den Gegner in die Irre führen und auch mal was riskieren, um langfristig Erfolg zu haben. Doch nun schickt sich Künstliche Intelligenz an, den Menschen auch bei diesen Fähigkeiten den Rang abzulaufen. Der Algorithmus »DeepNash« von Google gewann beim Spiel Stratego zuverlässig gegen menschliche Spieler, berichtet ein Forschungsteam im Fachblatt »Science« . Die Künstliche Intelligenz entschied 84 Prozent der Spiele für sich.

KI spielte zehn Milliarden Mal

Warum das so besonders ist? Stratego ist für einen Computer deutlich schwerer zu berechnen als Schach. Denn die Spieler bleiben lange im Ungewissen, wer der stärkste Gegner ist. Jede Spielerin hat 40 Spielfiguren mit unterschiedlichem Wert. Eine Figur ist die Fahne, die geschlagen werden muss. Die Krux: Der Gegner weiß nicht, welchen Wert eine Figur hat. Er erfährt es erst, wenn er die Figur angreift. Um zu gewinnen, müssen Spieler strategisch denken und den Gegner möglichst in die Irre führen.

Um das zu lernen, ließen die Entwickler von »DeepNash« den Algorithmus immer wieder gegen sich selbst antreten – insgesamt gut zehn Milliarden Mal. Ein Mensch bräuchte grob gerechnet eine Million Jahre, um so viele Partien zu spielen. »Entscheidend ist, dass die KI ihr Spielverhalten gelernt hat, indem sie eine unglaublich große Anzahl von Spielen gegen sich selbst spielt«, sagte Georg Martius vom Max-Planck-Institut für intelligente Systeme in Tübingen, der nicht an der Studie beteiligt war. »Bei diesem Spiel gegen sich selbst wird sich eine Strategie durchsetzen, die nicht durch kleine Änderungen des Gegners ausgenutzt oder umgangen werden kann.«

»Das ist ein bedeutender Erfolg für die KI-Forschung«

Kristian Kersting, TU Darmstadt

Durch das ständige Wiederholen habe das System erfolgreiche Muster erkannt und ähnliche Strategien angewandt, wie sie auch menschliche Stratego-Spieler zeigen, berichtet das Forschungsteam in der aktuellen Studie. So nahm das System etwa den Verlust von Figuren in Kauf, um zu erfahren, welche Figuren die ranghöchsten und damit gefährlichsten Figuren des Gegners sind.

Und: Die künstliche Intelligenz führte den Gegner auch hinters Licht und jagte mit einer rangniederen Figur eine ranghöhere des Gegners. Schlagen konnte das System die gegnerische Figur dadurch nicht, aber verschleiern, wo sich die eigenen ranghohen Figuren befinden.

»Das ist ein bedeutender Erfolg für die KI-Forschung, weil Stratego strategische Interaktionen im großen Maßstab benötigt«, sagte Kristian Kersting von der TU Darmstadt, der nicht an der Studie beteiligt war, über das Experiment.

Laut den Machern von »DeepNash« könnte sich das System auch in anderen Bereichen anwenden lassen. Es könne etwa den Verkehr modellieren. Allerdings lässt sich ein Brettspiel nur bedingt auf andere Anwendungen übertragen, sagt KI-Forscher Martius. »Voraussetzung ist immer, dass der Ablauf genau simuliert werden kann. In den meisten Anwendungen des Alltags ist das nicht gegeben.«

koe

Mehr lesen über

Die Wiedergabe wurde unterbrochen.