Deep Learning for Metro Delay Propagation Prediction: Combining Neural Network Architectures into Hybrid Models
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Djupinlärning för Förutsägelse av Tunnelbaneförseningar : Kombinera Neurala Nätverksarkitekturer till Hybrida Modeller (Swedish)
Abstract [en]
Public transportation, especially metro systems, is essential for urban mobility, with millions worldwide depending on timely services for their daily commutes. However, various factors can cause delays that disrupt the entire network. If not managed effectively, these primary delays can propagate through the system, leading to secondary delays and a cascading effect that impacts city operations and economic productivity. This thesis investigates the use of neural network models to predict delays propagation (both single-step prediction and multi-step prediction) in metro systems, focusing on the Stockholm metro. By utilizing General Transit Feed Specification (GTFS) static data and real-time vehicle position data accessed through Trafiklab’s API, the research explores how these models can forecast arrival delays of different metro trains at different stations. The study combines several neural network architectures— CNN, LSTM, and FCNN—into hybrid models, such as CNN+LSTM, CNN+FCNN, 2dLSTM+FCNN, 2dLSTM+FCNN and 2dLSTMt+LSTM, to identify the most effective approach for delay prediction. The CNN, 2dLSTM, and 2dLSTMt components identify patterns in operational data such as planned and actual running, interval (headway) and dwell times but also departure and arrival delays. At the same time the FCNN and LSTM components focus on non-operational features such as track length and number of shared tracks. The outputs are then merged, with an additional FCNN component analyzing relationships between the two types of data. Further, the research details the data processing, formatting, and model construction methods. Since planned arrival times were unavailable, they were estimated from vehicle position data, crucial for calculating key features in the study. The findings reveal that while no single model outperformed across all tasks, the iv CNN+LSTM model generally excelled, especially in complex scenarios involving multiple stations and trains. The best-performing model achieved an MSE of 7.065, an RMSE of 22.66, and an R2 of 0.8817. The results also showed that model performance is more dependent on the number of trains and stations considered rather than the prediction horizon. Additionally, the project analyzed feature contributions using SHapley Additive exPlanations (SHAP) plots, finding that the actual departure delay at the current station was the most significant predictor of delays. These results contribute to developing automated metro dispatching systems that reduce human error and enhance operational efficiency, leading to a more reliable and satisfying service for passengers.
Abstract [sv]
Kollektivtrafik, särskilt tunnelbanesystem, spelar en avgörande roll för urban mobilitet, där miljontals människor världen över förlitar sig på punktliga tjänster för sina dagliga resor. Trots detta kan olika faktorer leda till förseningar som påverkar hela nätverket. Om dessa primära förseningar inte hanteras effektivt kan de spridas genom systemet, vilket orsakar sekundära förseningar och skapar en kedjereaktion som påverkar stadens funktion och ekonomiska produktivitet. Denna avhandling undersöker hur neurala nätverksmodeller kan användas för att förutsäga förseningar i tunnelbanesystem, med särskilt fokus på Stockholms tunnelbana. Genom att använda både statiska data från General Transit Feed Specification (GTFS) och realtidsdata om fordonets position från Trafiklabs API, utforskar studien hur dessa modeller kan förutse förseningar vid olika stationer. Forskningen kombinerar flera neurala nätverksarkitekturer—CNN, LSTM och FCNN—i hybridmodeller som CNN+LSTM, CNN+FCNN, 2dLSTM+FCNN, 2dLSTMt+FCNN och 2dLSTMt+LSTM för att hitta den mest effektiva metoden för förseningsprognoser. I dessa modeller identifierar CNN-, 2dLSTM- och 2dLSTMt-komponenterna mönster i operativa data, medan FCNN- och LSTM-komponenterna fokuserar på icke-operativa faktorer. Dessa komponenter kombineras sedan, och en ytterligare FCNN-komponent analyserar sambanden mellan de två typerna av data. Forskningen beskriver också de metoder som användes för databehandling, formatering och modellkonstruktion. Eftersom planerade eller faktiska ankomsttider inte var tillgängliga, uppskattades de baserat på fordonspositionsdata, vilket var avgörande för att beräkna nyckelfunktioner i studien. Resultaten visar att även om ingen enskild modell presterade bäst i alla uppgifter, presterade CNN+LSTM-modellen generellt sett bäst, särskilt i mer komplexa scenarier vi som involverade flera stationer och tåg. Den bästa modellen uppnådde ett MSE på 7,065, en RMSE på 22,66 och ett R2-värde på 0,8817. Studien fann också att modellprestandan är mer beroende av antalet tåg och stationer som beaktas snarare än prognoshorisonten. Dessutom användes SHapley Additive exPlanations (SHAP) diagram för att analysera vilka faktorer som bidrog mest till förseningarna, och det visade sig att den faktiska avgångsförseningen vid den aktuella stationen var den mest betydande prediktorn. Dessa resultat bidrar till utvecklingen av automatiserade system för tunnelbanedispatching som minskar risken för mänskliga fel och ökar driftseffektiviteten, vilket leder till en mer pålitlig och tillfredsställande tjänst för passagerarna.
Place, publisher, year, edition, pages
2024. , p. 82
Series
TRITA-EECS-EX ; 2024:816
Keywords [en]
Train Delay Prediction, Neural Network, Delay Propagation, GTFS-Data, Hybrid Models
Keywords [sv]
Förutsägelse av Tågförseningar, Neurala Nätverk, Förseningsspridning, GTFS-Data, Hybridmodeller
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-360320OAI: oai:DiVA.org:kth-360320DiVA, id: diva2:1939989
Supervisors
Examiners
2025-02-272025-02-252025-02-27Bibliographically approved