Interview

Aus Daten lernen

Joachim Betz, Principal Transport Solution bei T-Systems, im Gespräch mit Peter Schütz, Leiter der Reisendeninformation der Deutsche Bahn AG.
Autor: Thomas van Zütphen
Fotos: Oliver Krato

Joachim Betz, T-Systems
Herr Schütz, was steckt hinter dem „Prognoseautomaten“? 

Der Prognoseautomat dient dazu, Kunden entlang ihrer geplanten Reiseverläufe mit maximal präzisen Informationen über die Ankunfts- und Abfahrtszeiten der Züge zu versorgen und bei Abweichungen vom Plan Alternativen aufzuzeigen. Diese Informationen werden vom Prognoseautomaten zentral von einem „Single Point of Truth“ aus auf sämtliche unserer Ausgabemedien „gespielt“. Das sind zum Beispiel die Bahnhofstafeln in den Hallen, verschiedenste Apps, Webseiten und Reiseportale im Netz. 

Was ist der Status quo? 

Im Fernverkehr, dem landesweit am besten vernetzten System mit bis zu 1.000 Zügen am Tag, profitieren unsere Reisenden und deren Abholer an den Bahnhöfen schon seit Mai vergangenen Jahres vom Prognoseautomaten. Ein in dieser Form verbessertes Reiseerlebnis war auch das Ziel, mit dem wir das Projekt 2015 auf den Weg gebracht haben. Die Ausgangsfrage lautete: Wie kommen wir zu der besten Anschluss- oder Verspätungsinformation für die Ankunfts- und Abfahrtszeiten unserer Züge? Unsere These damals war: Über viele, viele Daten und intelligente Algorithmik lässt sich eine zuverlässigere Vorhersage treffen und in Echtzeit an den Kunden bringen, als unsere alte Prognoselogik das konnte. Der Algorithmus berechnet die Istdaten immer bezogen auf den aktuellen Betriebszustand der Reiseroute des Kunden. Und zwar jede Minute aufs Neue. Denn besonders auf Fernstrecken kann sich der Betriebszustand jede Minute ändern. Bei der Direktfahrt eines Kunden von A nach B ist eine Minute in der Regel bedeutungslos. Bei Umstiegen jedoch kann eine Minute entscheidend sein. Deshalb ist es wichtig, dass wir zu einem frühen Zeitpunkt eine gute Umstiegsprognose bekommen und dem Kunden eine durchgängig verlässliche Reisekettenprognose bieten können.  

Was für Daten fließen in den Prognoseautomaten ein? 

Zuglaufinformationen, Dispositionsentscheidungen, aber auch sekundäre Informationen, die das System aus Verspätungsangaben anderer Züge gewinnen kann und mit denen umzugehen der Algorithmus gelernt hat. Im Livebetrieb des Prognoseautomaten heute sind das alles Bestandsdaten, die wir durch die Algorithmen schleusen. Das wird in Zukunft durch Umlaufinformationen, Wetterdaten, GPS-Angaben etc. ergänzt, um damit einen kürzeren und zugleich noch valideren Informationszyklus zu bekommen. Denn für diesen Service gibt es auf technischer Seite nur zwei Hebel der Verbesserung: einerseits die Daten – die Vielfalt ihrer Quellen und ihre Bereitstellungsfrequenz – sowie andererseits den Algorithmus. 

Stichwort „Zukunft“ – was planen Sie als Nächstes? 

Der Anspruch ist, die Prognosegüte im Fernverkehr noch weiter zu verbessern und parallel 2019 damit zu beginnen, die Regionalzüge und Metropolenverkehre zu integrieren. Es geht immer darum, mit den Daten zu lernen und daraus abzuleiten, welche Verbesserung sich daraus ausrollen lässt. Das bedeutet nichts anderes, als die richtigen Dinge aus den Daten auszulesen. Wenn Sie so wollen, ein Standardprozess in der Big-Data-Welt. Dazu gehört auch schnelles „Failen“, Daten auszusortieren, um in einem Portfoliofunnel zu sagen: Das sind die Treiber, mit denen wir für eine Verbesserung der Prognosen noch einmal den größten Hub schaffen können. Dann geht es darum, diese Elemente zu übernehmen und sie in die Produktion einzuführen. Dafür wollen wir unsere Datenquellenlandschaft sukzessive erweitern und im Fernziel auch den ÖPNV einbinden, also Busse, U- und S-Bahnen integrieren.

Und wann kommt IT-seitig ein Kooperationspartner ins Spiel? 
Peter Schütz, Deutsche Bahn
​​​​​​​

Zunächst einmal: Für die vielen Millionen Prognosen, die täglich erstellt werden, nutzen wir modernste Technologien. Microservices zum Beispiel, die die Daten minütlich konsolidieren, automatisiert skalierbar, auf Big-Data-Plattformen in der Cloud. Das liefert uns die Skalierbarkeit, mit der wir sehr flexibel werden. Moderne IT ist heute ein Cloudbetrieb. Doch die Idee unserer Kooperation mit T-Systems ist eine andere: Wir bringen das Bahnwissen mit, T-Systems das algorithmische Wissen – also das Wissen, wie man den richtigen Algorithmus findet, um ein bestimmtes Problem zu lösen. Sie stellen die kompetente Truppe, die Analytics beherrscht und sowohl KI wie Big Data kann. Wenn beide Gruppen nicht nur aufseiten der jeweiligen Datascientists hochintegrativ zusammenarbeiten, steckt dahinter echte Power. Analytische Power, Umsetzungspower und sehr viel Kompetenz. Da sind wir gut unterwegs, können uns aber auch an dieser Stelle sicherlich immer weiter verbessern. Und mit jeder Verbesserung werden wir unsere Messlatte höher legen. Das ist die so genannte „Prognosegüte“. Im Fernverkehr liegt sie heute, 30 Minuten vor der Ankunft eines Zuges, bei 87,5 Prozent. Anstreben wollen wir aber eine Prognose güte von 95 Prozent, idealerweise sogar 99 Prozent. 

Wie wollen Sie da hinkommen? 

Eine möglichst vollständige Reisebegleitung braucht Informationen von allen beteiligten Verkehrsträgern. Und da reden wir über 800.000 Fahrten täglich in den öffentlichen Verkehren in Deutschland. Deshalb binden wir in die Reiseinformationsplattform bereits sehr viele externe Unternehmen ein, sodass wir die Informationskanäle konsistent gut versorgen können. Wir haben bewusst gesagt, wir stellen die Basisinformationen nicht nur den DB-Unternehmen zur Verfügung, sondern auch allen externen Verkehrsunternehmen, sodass die gesamte Branche davon profitiert. Dazu zählt auf lange Sicht auch der Flugverkehr, also die Echtzeitversorgung mit Start- und Landeinformationen der Airlines und Flughäfen. Das ist die Zukunft. Grundsätzlich ist die Prognosefähigkeit an sich noch kein USP. Das ist eher Branchenstandard. Aber in dieser Güte Vorhersagen abzugeben, wie der Prognoseautomat es im Fernverkehr heute bereits kann, ist im internationalen Vergleich schon etwas Besonderes. Darum investieren wir, um diesen Service immer noch weiter auszudehnen und schneller zu machen.


Schneller als „Echtzeit“ geht aber kaum. 

Es geht nicht um systemische Geschwindigkeit, sondern um den Speed der Projektumsetzung. Zu 30 Prozent entscheidet darüber die Qualität des Algorithmus. Zu 30 Prozent die Qualität der Daten. Aber zu 40 Prozent auch unsere Arbeitsweise. An manchen Stellen arbeiten wir im Team noch redundant. Wir müssen dazu kommen, dass wir durch die Arbeitsweise noch schneller an den Markt kommen. Das ist der nächste Schritt. Und da habe ich auch Vertrauen in die Partnerschaft. Das klappt.

Ihr Ansprechpartner:​​​​​​​ J.Betz@t-systems.com