Forum: Wissenschaft
Heads-up no-limit: Software schlägt Poker-Profis
Carla Schaffer/ AAAS

Beim Pokern waren Computer bislang keine allzu starken Gegner. Dank Künstlicher Intelligenz ändert sich das nun. Beim Duell zweier Spieler ohne Einsatzlimit zeigt eine neue Software nun Profis ihre Grenzen.

l/d 03.03.2017, 07:53
1. Ich glaube nicht,

dass man diese Optimierung des Verhaltens unter den Begriff Intelligenz einordnen sollte, denn auch hier werden gesammelte Erfahrungen genutzt, um die Summe der möglichen Aktionen (Antworten) auf eine mögliche bewährte einzugrenzen. Das ist ein Verhalten, wie es den Instinkten entspricht, bei dem die Summe der Erfahrungen der Art mit ganz bestimmten Wahrnehmungen (Situationen) genutzt wird, um ein bewährtes Verhalten zu veranlassen.

Solche Instinkte fühlt man als Mensch noch als Bauchgefühl, aber das hat eben nicht mit Intelligenz und auch nichts mit Intuition zu tun, wobei letztere am ehesten als Wissen zu bezeichnen ist, das weder den Instinkten, noch persönlichen Erfahrungen noch dem eigenen Nachdenken entstammt, sondern von uns wie "eingegeben" empfunden wird.

Beitrag melden Antworten / Zitieren
Mister Stone 03.03.2017, 08:38
2.

Die Onlinespieler brauchen keine Sorge zu haben, dass sich eine neue Gefahr auftut. Es ist nämlich gar nicht nötig, solche "superintelligenten" Bots beim Onlinepoker einzusetzen. Solange es möglich ist, dass Bots die gegnerischen Karten "einsehen", würde es - wenn man es denn tun wolte - ausreichen, die ganz einfachen Bots einzusetzen, um Realspieler auszunehmen. Das gilt für alle Online-(Karten-)Spiele mit unvollständigen Informationen.

Beitrag melden Antworten / Zitieren
theroadtoutopia 03.03.2017, 08:50
3. Fehlendes Glied für interessante Anwendung

Für erfolgreiche Machine-Learning-Anwendungen, die in vieldimensionalen Spielen mit unvollständiger Information eine Leistungsfähigkeit ähnlich der des Menschen erreichen können, gibt es ausgesprochen lukrative Anwendungsmöglichkeiten.

Nicht zuletzt könnte die Weiterentwicklung derartiger Systeme sehr hilfreich bei der Einführung selbständig agierender Fahrzeuge sein, da dann ein Fahrzeug lernen kann, das Verhalten der anderen Verkehrsteilnehmer einzuschätzen. Genau das macht ein (vernünftiger) Autofahrer auch: Man fährt in 9 Autos - dem eigenen und denen, die um einen herum sind.
Ich hatte zwar nur selten mit dem Automotive-Bereich zu tun, aber bei den vielen Millionen potentiellen Kunden in den asiatischen Riesenmetropolen lohnt sich fast jede Investition in solche Systeme.

Beitrag melden Antworten / Zitieren
kpdsu 03.03.2017, 09:02
4.

Ist vielleicht nicht Intelligenz im klassischen Sinne, aber diese Art zu lernen ist natürlich Teil intelligenten Verhaltens.

Beitrag melden Antworten / Zitieren
AntiDe 03.03.2017, 09:07
5.

...steigt dabei von 10^17 (bei limitiertem Einsatz) auf 10^160 - eine unvorstellbar große Menge, weit mehr als die Zahl der Atome im Universum."

Nun, die Größe des Universums ist unbekannt, aber so klein ist es nach neuesten Erkenntnissen vermutlich nicht. Hier hätte man "im sichtbaren Universum" schreiben sollen, sonst ist es verwirrend. Denn unter "Universum" schlechthin verstehen die meisten Menschen etwas umfassenderes, so auch der Wikipedia-Artikel.

Beitrag melden Antworten / Zitieren
hak 03.03.2017, 13:47
6. Libratus und Deep Stack

Guten Tag,

der Artikel liest sich ein kleines bißchen so, als ob die Eigenschaften von zwei KIs miteinander vermixt wurden. Die eine KI, Libratus, hat in einem sehr professionell ausgerichteten Turnier im Rivers Casino in Pittsburgh hochgradig statistisch signifikant gegen vier der besten no-limit Texas Hold 'em Pokerspieler der Welt gewonnen. Details dazu stehen u.a. auf Wikipedia unter "Libratus". Libratus benutzt keinerlei neuronale Netze, sondern setzt auf Reinforcement Learning und sogar einen klassischen LP Solver.

DeepStack hat als eine Komponente, nämlich als Bewertungsfunktion, ein tiefes neuronales Netz. Dieses Netz simuliert nicht Poker, sondern lernt aus simulierten Pokerpartien. Außerdem haben die Entwickler von DeepStack noch viele andere interessante Ideen gehabt, die in dem Arxiv-Artikel ("DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker") beschrieben werden.

DeepStack ist aber noch nicht mit der selben Sicherheit als superstarkes Programm bewiesen, denn 1.) wurden die Gegenspieler nicht so sorgfältig ausgewählt wie bei Libratus, 2.) die Zahl der Partien pro Spieler war klein, eigentlich zu klein, 3.) es gab meines Wissens nach keine finanzielle Incentivierung der Spieler, die sie zur Ernsthaftigkeit angefeuert hätte, 4.) es wurde meines Wissens nach nicht die wichtige Maßnahme durchgeführt, die bei Libratus zum Chancenausgleich gemacht wurde, nämlich dass das Kartenglück ausgeglichen wurde (die Pärchen Spieler A-Libratus A und Spieler B-Libratus B bekamen jeweils exakt die gleiche, zufällige Kartenreihenfolge, nur bei B im Vergleich zu A vertauscht, sodass das "Glück" mal mehr auf Seiten der Spieler, mal mehr auf Seiten der KI war).

Was also aussteht, ist ein direkter Wettkampf von DeepStack gegen Libratus.

Schöne Grüße.

Disclaimer: Die Firma, die ich mitmanage, war einer der Sponsoren dieses Turniers; die Libratus-Entwickler werden auch am 2. Juni in München zu Gast sein.

Beitrag melden Antworten / Zitieren
calinda.b 03.03.2017, 15:01
7. Im Ernst?

"Wenn die Spieler befürchten müssen, dass eine praktisch unschlagbare Maschine mit ihnen am virtuellen Spieltisch sitzt, könnte die Internet-Zockerei ihren Reiz verlieren."

Zu spät dafür. Abertausende Studente spielen auch, alle anderen an ihrem 'Tisch' sitzen zusammen in derselben Studentenbude und zeigen sich gegenseitig ihre Karten und teilen sich ihr Geld nach der Partie.
Nur Hirnis spielen Poker online.

Beitrag melden Antworten / Zitieren
Landkaertchen 03.03.2017, 20:53
8. Intelligenz ...

setzt sich aus vielen Komponenten zusammen. Und einiges davon konnten Maschinen schon länger und auch schon sehr viel schneller, als der Mensch: Sich etwas merken und das gemerkte auf Abruf wiederfinden. Rechnen sowieso. Logische Schlüsse aus Sachverhalten mit vollständiger Information ziehen. Wahrscheinlichkeiten berücksichtigen, wenn wenig Information fehlt. Sortieren und Filtern in unermesslicher Geschwindigkeit. Objekte an Hand von Konturen wiedererkennen, wenn die Ähnlichkeit sehr groß ist.

Gefehlt haben bisher viele Fähigkeiten, die mit Erfahrung, Bauchgefühl oder komplexen visuellen, akustischen oder gemischten Signalen zusammen hängen. Also Daten, die so unvollständig sind, dass sie nur mit Erfahrung sinnvoll verarbeitet werden können. Spiele-Szenarien sind hier nur Mittel zum Zweck, einfach vergleichbare "Umgebungen" in der Wissenschaft zu konstruieren.

Die bisher fehlenden Komponenten kommen nun durch den Einsatz von Deep Learning hinzu. Eine solches simulierte neuronale Netzteil an sich ist ein homogenes Netzteil mit vielen freien Variablen pro Netzknoten. Dazu kommt das Design der Wissenschaftler, das sozusagen verschiedene Intelligenz-Komponenten geschickt verknüpft. Entspricht der Nervenstränge zwischen Hirnarealen.

Resultat: Das tiefe Netzteil wird mit bereits früher schon übermenschlichen Intelligenzkomponenten verknüpft (rechnen, logisch bewerten, speichern). Und man kann so ein System auch als "Lernumgebung" eines zweiten Systems zur Verfügung stellen. Also als Simulationsmodell. Und was nun weiter übermenschlich ist: damit Jan ein System nun in rassanter Geschwindigkeit die simulierte Umgebung erkunden und notwendige Fähigkeiten erlernen. Denn beim Lernen sind wir Menschen langsam. Das Ende des Autos erlernen wir durch reale Situationen mit dem Bordstein oder dem parkenden Auto hinter uns. Das Neuronale Netz benötigt keine reale Umgebung, sondern eine realitätsgetreue Simulation reicht, um tausende Bordsteinkontakte pro Sekunde zu bekommen. Genau hier liegt die Neuheit und der sportliche Angriff auf die menschliche Intelligenz.

Selbst künstliche künstlerische Kreativität ist in naher Zukunft erreichbar. Nachdem Google seine Bilderkennung vor 1 1/2 Jahren in Trance versetzt hat und man nun nur noch eine logisch antreibende Kraft dafür finden muss, diese Intiution in für uns Menschen als sinnvolle künstlerische empfundene Ergebnisse zielführend umsetzen muss, ... Die nächsten Jahre werden spannend! - Wichtig nur, dass der Ersatz bestimmter Berufsgruppen vernünftig organisiert wird. - Auf alle Fälle werden Ärzte in absehbarer Zukunft auch ungewöhnliche, weil seltene Erkrankungen mit Hilfe solcher Systeme sehr frühzeitig diagnostizieren können. Also kein Grund zur Angstmache bzgl. Arbeitsplätze.

Beitrag melden Antworten / Zitieren
julia.muller.9849 03.05.2017, 21:54
9. Lernbasierte Poker Alogorithmen

Spielentscheidungen:
lv = 8, np = 5, pv = 50, ac = 7,53
Spieler wird mitgehen (Call).
lv = 8, np = 3, pv = 50, ac = 12,57
Spieler wird erhöhen (Raise) um 11 Einheiten. (Weniger Spieler)
lv = 9, np = 3, pv = 50, ac = 15,89
Spieler wird erhöhen (Raise) 16 Einheiten. (Bessere Erfahrungen mit der
Hand)
Wird eine Hand gespielt und der Spieler gewinnt, wird der Lernwert um
0,1 erhöht. Verliert der Spieler wird der Lernwert um 0,1 herabgesetzt.
Quelle: https://www.casinotoprating.com

Beitrag melden Antworten / Zitieren