CeBIT: HPI stellt „S-Bahn Analyzer“ auf Basis von Twitter-Auswertung vor

Die Analysesoftware nutzt In-Memory-Datenbanktechnik, um Tweets zu aktuellen Beeinträchtigungen des Bahnverkehrs in computerlesbare Daten umzuwandeln und in Echtzeit auszuwerten. Dadurch sollen sich Fahrgäste besser auf Unregelmäßigkeiten einstellen und Verkehrsunternehmen frühzeitig auf Engpässe reagieren können.

Forscher des Potsdamer Hasso-Plattner-Instituts (HPI) präsentieren auf der CeBIT in Hannover (Halle 6, Stand D18) eine neue Analysesoftware namens „S-Bahn Analyzer“, die Twitter-Einträge zu Beeinträchtigungen im öffentlichen Nahverkehr auswertet. Dadurch sollen sich Fahrgäste auf Unregelmäßigkeiten besser einstellen und Verkehrsunternehmen frühzeitig auf besondere Ereignisse reagieren können.

S-Bahn Analyzer (Bild: HPI)Gemeinsam mit der S-Bahn Berlin arbeitet das HPI daran, auftretende Beeinträchtigungen in Echtzeit zu analysieren. So lässt sich beispielsweise erkennen, welche Verkehrsereignisse zu welcher Zeit an bestimmten Orten gehäuft auftreten und gemeldet werden, um frühzeitig darauf reagieren zu können.

„Für Verkehrsunternehmen sind solche Auswertungen wichtig, bedeuten heutzutage jedoch sehr hohen Aufwand bei der Datenanalyse“, erklärt HPI-Direktor Christoph Meinel. Dank des HPI-Systems könne künftig sowohl schon bei der Verkehrsplanung als auch im laufenden Betrieb besser auf Engpässe und Unregelmäßigkeiten und deren Auswirkungen reagiert werden. Einen besonderen Vorteil erhoffen sich Wissenschaftler und Praktiker von der Möglichkeit, aus vergangenen Vorkommnissen aktuelle Ereignisse besser einschätzen zu können.

„Ziel ist es, frühzeitig Alternativen zu erkennen, wenn plötzliche Störungen im Ablauf des öffentlichen Nahverkehrs Reisepläne aus dem Takt zu bringen drohen“, erläutert HPI-Projektleiter Matthieu-P. Schapranow. Für die permanente Analyse von Tweets über aktuelle Betriebsstörungen kommt die am HPI erforschte In-Memory-Datenbanktechnik zum Einsatz. Sie ermöglicht es unter anderem, von Menschen geschriebene Texte in computerverständliche Informationen zu übersetzen. Damit können dank paralleler Verarbeitung selbst riesige Datenmengen schnell analysiert und ausgewertet werden.

HPI-Projektleiter Matthieu-P. Schapranow demonstriert den S-Bahn Analyzer auf der CeBIT in Hannover (Bild: HPI/Kay Herschelmann).HPI-Projektleiter Matthieu-P. Schapranow demonstriert den S-Bahn Analyzer auf der CeBIT in Hannover (Bild: HPI/Kay Herschelmann).„Aus den Twitter-Kurznachrichten der S-Bahn extrahieren wir so zum Beispiel Informationen über betroffene Linien, Bahnhöfe oder Gründe, verknüpfen diese und errechnen in Echtzeit Prognosen für künftige Ereignisse“, so Schapranow. Die HPI-Software könne jederzeit in Live-Statistiken anzeigen, was die häufigsten Arten von Vorfällen sind und zu welchen Tageszeiten welche Ereignisse für welche Linien besonders oft gemeldet werden. Nutzt ein Anwender die Informationen, welche die S-Bahn Berlin den Kunden bereitstellen will, soll er sich angesichts der jeweiligen Situation auf die Wahl der Route und des Verkehrsmittels einstellen können, um mit möglichst geringem Zeitverlust ans Ziel zu kommen. „Fahrgäste, denen mehrere Routen zur Wahl stehen, können künftig diejenige wählen, für die die geringste Wahrscheinlichkeit für störende Ereignisse prognostiziert wurde“, sagt Schapranow.

Die größten Herausforderungen für die Informatiker am HPI sind die sofortige Analyse der unstrukturierten Texte, deren Kombination mit historischen Daten sowie deren interaktive Exploration. Erste Erkenntnisse aus der Analyse zehntausender Tweets der Berliner S-Bahn seit Mitte 2013 ergaben bisher, dass gut die Hälfte Hinweise auf Ereignisse im Betriebsablauf geben. Meistens handelt es sich um Ausfälle oder Verspätungen von Zügen. Am häufigsten genannter Grund ist der „Polizeieinsatz“, gefolgt von „Notarzteinsatz“.

Die HPI-Wissenschaftler brachten ihrer Software bei, selbst verschiedene Deklinationsformen, Abkürzungen und Umlautschreibweisen von Stichwörtern zu erkennen. Eine „fuzzy search“ (zu Deutsch: unscharfe Suche) genannte Suchmethode vergleicht zwei Wörter buchstabenweise, berechnet einen Ähnlichkeitswert und beurteilt danach, wie wahrscheinlich die Übereinstimmung mit einem relevanten Stichwort ist.

Whitepaper

Studie zu Filesharing im Unternehmen: Kollaboration im sicheren und skalierbaren Umfeld

Im Rahmen der von techconsult im Auftrag von ownCloud und IBM durchgeführten Studie wurde das Filesharing in deutschen Unternehmen ab 500 Mitarbeitern im Kontext organisatorischer, technischer und sicherheitsrelevanter Aspekte untersucht, um gegenwärtige Zustände, Bedürfnisse und Optimierungspotentiale aufzuzeigen. Jetzt herunterladen!

Tipp: CeBIT: Was wissen Sie über die wichtigste IT-Messe der Welt? Machen Sie den Test mit unserem Quiz auf silicon.de!

Themenseiten: Datenbank, Forschung

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu CeBIT: HPI stellt „S-Bahn Analyzer“ auf Basis von Twitter-Auswertung vor

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *