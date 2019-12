Auf dem Hackerkongress des Chaos Computer Clubs (CCC) geht es traditionell nicht nur um Sicherheitslücken oder Netzpolitik, sondern auch um die Macht der Daten: Der Datenexperte David Kriesel etwa widmet sich in einem Vortrag den Verspätungen und Ausfällen im Fernverkehr der Deutschen Bahn. Damit will er gefühlten Wahrheiten auf den Grund gehen - und andere ermuntern, es ihm gleichzutun.

SPIEGEL: Herr Kriesel, Sie haben über das Jahr 2019 hinweg 25 Millionen Zughalte auf ihre Pünktlichkeit hin analysiert. Dabei gibt es doch längst Verspätungsstatistiken der Bahn, wozu die ganze Arbeit?

David Kriesel: Die Statistiken zeigen meistens radikal zusammengefasste Durchschnittswerte, beispielsweise wie viele Zug-Halte bundesweit pro Monat verspätet sind. Die Reisenden selbst fragen sich aber doch ganz andere Dinge.

SPIEGEL: Was denn zum Beispiel?

Kriesel: Als Reisender möchte ich wissen: Sind die Züge, die ich nehme, öfter verspätet als die anderen oder kommt mir das nur so vor? Ich habe mich das auch selbst gefragt, so kam ich auf das Projekt.

SPIEGEL: Hatten Ihre Züge denn so oft Verspätung?

Kriesel: Allerdings. Ich reise beruflich häufiger mit der Bahn, meistens steige ich in Bonn oder Köln ein. Eine Zeit lang bekam ich zu jedem zweiten Zug eine Verspätungsmeldung. Das passte aber zu keiner Statistik, denn natürlich ist nicht jeder zweite Zug verspätet. Deshalb wollte ich wissen, wie das zusammenpasst. Also habe ich mir die Daten angesehen.

Zur Person David Kriesel David Kriesel, Jahrgang 1984, hat Informatik studiert und arbeitet als Data-Science-Experte. Er befasst sich mit gesellschaftlich relevanten Themen, indem er öffentlich verfügbare Datensätze analysiert. Nachdem er einst auf dem Congress des Chaos Computer Clubs bereits die Artikel von SPIEGEL ONLINE ausgewertet hatte, ist diesmal die Bahn dran.

SPIEGEL: Was ist darunter zu verstehen?

Kriesel: Die Bahn stellt ihre Daten über technische Schnittstellen jedem zur Verfügung. Das sind dieselben Schnittstellen, die man mit dem Smartphone nutzt, wenn man guckt, ob ein Zug pünktlich ist. Mein Computer hat die einfach regelmäßig abgefragt und mir seit Januar jeden Halt an jedem Fernbahnhof des Landes gespeichert, mehr als 50.000 Halte pro Tag. So konnte ich zum Beispiel einzelne Bahnhöfe systematisch miteinander vergleichen.

SPIEGEL: Und auf die Ergebnisse kann man sich verlassen?

Kriesel: Es kann natürlich immer zu Fehlern kommen, es handelt sich hierbei schließlich um ein Hobbyprojekt, das ich in meiner Freizeit auf die Beine stelle. Vielleicht sind auch die Daten der Bahn nicht völlig fehlerfrei, ganz sicher kann man nie sein. Ich bin aber insgesamt zuversichtlich, was die Qualität der Daten angeht - auch, weil die von mir gemessenen Zug-Ausfallquoten ähnlich aussahen wie bei anderen Untersuchungen.

SPIEGEL: Und, sind einzelne Bahnhöfe wirklich schlechter dran?

Kriesel: Meinen Berechnungen zufolge kann man das so sagen, ja. An meinem Heimatbahnhof Bonn zum Beispiel kommt es tatsächlich vergleichsweise oft zu Verspätungen, da habe ich mich nicht getäuscht. In Hamburg sieht es insgesamt auch nicht so toll aus. Es kommt aber auch darauf an, ob ein Bahnhof ganz am Anfang oder ganz am Ende einer Strecke liegt.

SPIEGEL: Warum?

Kriesel: Manche Züge, die verspätet sind, fahren die letzten planmäßigen Halte offensichtlich einfach nicht mehr an. Die fallen dann dort einfach aus.

SPIEGEL: Da kommen die Züge dann aber nicht nur zu spät, sondern überhaupt nicht.

Kriesel: Exakt. Genau da liegt ein interessanter Punkt. Halte, die komplett ausfallen, fallen einfach aus der Verspätungsstatistik der Bahn heraus. Das heißt, wenn sich die Bahn entscheidet, einen verspäteten Zug spontan ausfallen zu lassen, kann es sein, dass deren Verspätungsstatistik besser wird, und nicht schlechter.

SPIEGEL: Und wie verhält sich das bei Ihrer Statistik?

Kriesel: Für die Reisenden ist ein ausgefallener Zug mindestens so ärgerlich wie ein verspäteter. Deshalb berücksichtige ich in meiner persönlichen Statistik sowohl die verspäteten als auch die ausgefallenen Züge. Ich finde, unpünktlich ist nicht nur der Zug, der zu spät kommt, sondern auch der, der ausfällt.

SPIEGEL: Gibt es Unterschiede zwischen den einzelnen Zugtypen, was die Zuverlässigkeit angeht?

Kriesel: Ja. Ich habe mir sowieso nur den Fernverkehr an den rund 350 Fernbahnhöfen in Deutschland angesehen. Dabei ist mir aufgefallen, dass Eurocity-Züge (EC) offenbar durchschnittlich am spätesten dran sind. Das ist erst mal plausibel, die sind sehr international unterwegs und bringen teilweise Verspätung schon mit nach Deutschland. Was mich persönlich aber sehr überrascht hat, war das Flaggschiff der Bahn: Die Intercity-Express-Züge (ICE) scheinen mit Abstand am häufigsten auszufallen.

SPIEGEL: Nämlich wie oft?

Kriesel: Über den erfassten Zeitraum sind nach meinen Daten gut fünf Prozent der ICE-Halte einfach ausgefallen. Bei den EC waren es nur zwei Prozent, beim Intercity (IC) gut drei Prozent. Man kann eigentlich sagen: Jeder 20. ICE kommt einfach nicht. Im Sommer scheinen sogar noch mehr Halte auszufallen.

SPIEGEL: Was ist denn im Sommer?

Kriesel: Anscheinend haben die ICE ein Sommerproblem. Im Juni und Juli fielen laut meinen Daten ungefähr acht Prozent der ICE-Halte aus. In der heißesten Woche des Jahres waren es sogar durchschnittlich zehn Prozent. Das ist weit mehr, als ich erwartet hatte.

SPIEGEL: Wo kommen die Züge meistens pünktlich?

Kriesel: Grundsätzlich lässt sich sagen, dass es im Osten besser aussieht als im Westen der Republik: Halle, Leipzig oder Magdeburg zum Beispiel erreichten besonders gute Pünktlichkeitsquoten. Aber nicht alle Bahnhöfe sind miteinander zu vergleichen.

SPIEGEL: Warum nicht?

Kriesel: Wenn an einem kleinen Bahnhof nur drei Fernzüge halten, sind drei Verspätungen eben schon 100 Prozent. Das muss man berücksichtigen. Der Bahnhof in Fürth zum Beispiel ist ein Schlusslicht in meiner Statistik, aber das heißt nicht viel, da halten nicht so viele Züge.

SPIEGEL: Fast ein Jahr lang haben sie nun jeden Zughalt erfasst und analysiert. Welche Lehren ziehen Sie aus den Ergebnissen?

Kriesel: Zuerst einmal muss man sagen: Nicht alles ist schlecht. Im Nahverkehr hat die Bahn sehr hohe Pünktlichkeitsquoten und bringt täglich zahllose Leute zur Arbeit. Es wird ja gern viel geschimpft, aber das ist nicht immer gerechtfertigt. Allerdings: Wenn man Ausfälle als unpünktlich zählt, scheint die Bahn im Fernverkehr nur auf 72,5 Prozent Pünktlichkeit zu kommen. Das bedeutet: Umsteigen ist also ein Risiko. Ich würde also stets eine Direktverbindung wählen, wenn es eine gibt. Außerdem versuche ich nun, Start- und Endbahnhöfe einer Strecke zu meiden, wenn ich die Wahl habe. Und Vorsicht mit ICEs im Sommer.

SPIEGEL: Braucht man für diese Erkenntnisse wirklich so einen Datenberg?

Kriesel: Je größer der Datenberg, desto mehr Freiheiten hat man in der Auswertung. Die Daten verraten ja noch viel mehr. In meiner Datenauswertung lässt sich der Sturm Eberhard im März 2019 deutlich ablesen. Und auch der tragische Tag, an dem in Frankfurt ein Junge vor einen Zug geschubst wurde, spiegelt sich in der Statistik wider. Data Science bildet eben die Realität ab, die schlechte wie die gute. In einer Zeit, in der gefühlte Wahrheiten viel gelten, möchte ich die Leute inspirieren, genauer hinzuschauen und auch einmal eigene Analysen zu starten. Es lohnt sich.