Fotostrecke

KI im Sport: So funktioniert die "Random-Forest"-Methode

Foto: Ryan Pierse/ Getty Images

Fußball-Prognosen Wo Deutschland Waldmeister ist

Prognosen sind so alt und fehleranfällig wie der Sport selbst. Eine neue Methode verspricht Besserung: Lassen sich mithilfe maschinellen Lernens künftig die Ergebnisse im Fußball zuverlässiger vorhersagen?
Von Otto Kolbinger

Ein kurzer Moment der Fassungslosigkeit, dann folgt die erneute Nachfrage, ob das Gehörte tatsächlich gesagt wurde. Ab da schallendes Gelächter. Diese Reaktion von Andreas Granqvist, Kapitän der schwedischen Nationalmannschaft, wurde nach dem Vorrunden-Aus der deutschen Nationalmannschaft bei der WM in Russland zu einem Social-Media-Hit.

Das Video vereint die beiden häufigsten Reaktionen auf die Blamage der Löw-Elf: Häme und vor allem Ungläubigkeit. Ein derartiges Abschneiden hielten vor dem Turnier weder Fans noch Experten (und solche, die es gern wären) für möglich.

Auch daten- und algorithmusbasierte Vorhersagemodelle, die vor Großturnieren immer ins Blickfeld der Öffentlichkeit rücken, hielten dieses Szenario für ausgeschlossen. Verschiedene Finanzdienstleister erlangen durch solche Prognosen seit mehr als 20 Jahren regelmäßig eine (Marketing-)Bühne bei diesen Turnieren, aber auch Wissenschaftlern bietet sich die Möglichkeit, öffentlich wirksam algorithmische Fähigkeiten zu demonstrieren.

Maschinelles Lernen soll Prognosen verbessern

Für die Weltmeisterschaft 2018 wurden dabei erstmals Verfahren auf Basis maschinellen Lernens eingesetzt, die einen Vorteil gegenüber den bisher üblichen statistischen Analysemodellen bringen sollen. Zum einen von Goldman Sachs, die aber lediglich sehr oberflächlich darüber Auskunft geben, welche Verfahren genutzt wurden. Zum anderen von einer Gruppe Wissenschaftler der Technischen Universität Dortmund, der Universität Gent und der Technischen Universität München, die naturgemäß sehr detailliert Auskunft über den gewählten algorithmischen Ansatz geben. In diesem Fall die sogenannte Random-Forest-Methode .

Grob vereinfacht dargestellt, zieht der Algorithmus zufällige Teile aus einem Datensatz und kreiert daraus Tausende Entscheidungsbäume zur Vorhersage. So entsteht ein zufälliger Wald ("Random Forest"). Angewendet auf den Fußball lässt sich so der Erwartungswert für Tore anhand verschiedener Merkmale einer Mannschaft vorhersagen. Sie finden das kompliziert? Wir auch! Deshalb versuchen wir hier, dies für Sie bildlich anhand des WM-Auftaktspiels der deutschen Mannschaft gegen Mexiko zu erklären:

Fotostrecke

KI im Sport: So funktioniert die "Random-Forest"-Methode

Foto: Ryan Pierse/ Getty Images

Das Modell lag nicht nur beim Ausgang des Spiels gegen Mexiko (0:1) falsch, sondern auch bei der Vorhersage des Weltmeisters. Das als wahrscheinlichster Turnierverlauf berechnete Szenario hatte nämlich Deutschland sogar als Weltmeister ausgegeben. Ist man dem Ziel einer möglichst genauen Vorhersage am Ende trotz dieser Fehlprognosen ein wenig nähergekommen?

Spoilergefahr bei künftigen WM-Turnieren?

Ja, denn der Vorteil dieses Ansatzes bestätigt sich beim großflächigen Abgleich des Modells mit der Wirklichkeit. Mit einer Veröffentlichung  in der Fachzeitschrift "Statistical Modelling" demonstrierte ein Teil der Forschergruppe, dass durch den Random-Forest-Ansatz tatsächlich bessere Vorhersagen möglich sind. Die Abweichung der vorhergesagten zu den tatsächlichen Resultaten wurde verringert, die richtige Tendenz mit einem Ansatz sogar über zwei Prozent häufiger korrekt prognostiziert, als es den Wettanbietern gelang. Nimmt man also eine große Anzahl an Spielen, liegen die Prognosen immer öfter richtig oder, andersrum, weniger oft falsch als in dem aufgezeigten Beispiel der deutschen Nationalmannschaft.

Müssen wir somit Sorge haben, dass uns künftig der Ausgang einer WM bereits vor dem Turnier gespoilert wird? Dass die Prognosen besser werden und dieser Trend speziell durch Verfahren des maschinellen Lernens verstärkt wird, ist nicht unwahrscheinlich. Es wird aber immer genug Unabwägbarkeiten geben. Selbst für den unwahrscheinlichen Fall, dass ein Modell gefunden wird, welches alle relevanten Variablen vor einem Spiel berücksichtigt, können Fans dafür auf die Natur des Spiels Fußball bauen.

Zur Person

Otto Kolbinger, geboren 1987 in München, studierte Sportwissenschaften an der Technischen Universität München und ist dort seit 2013 als wissenschaftlicher Mitarbeiter beschäftigt. 2018 schloss er seine Promotion zum Thema "Innovative technische Hilfsmittel zur Unterstützung von Schiedsrichtern in Spielsportarten als Gegenstand von Evaluationsforschung" ab. Seit 2013 ist er zudem als freiberuflicher wissenschaftlicher Berater tätig. Seit 2016 unterstützt er SPIEGEL ONLINE in einem Google-DNI-Projekt.

Interaktion, Dynamik und nicht zuletzt Zufall - springt der Ball von der Latte ins Tor oder wieder zurück ins Spiel - werden auch weiter für Ergebnisse sorgen, die uns ungläubig zurücklassen. Und nicht immer wird die deutsche Nationalmannschaft der Leitragende dieser Abweichungen sein.

Die Wiedergabe wurde unterbrochen.