kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
The Application of Tree-Based Algorithms on Classifying Shunting Yard Departure Status
KTH, School of Architecture and the Built Environment (ABE), Civil and Architectural Engineering, Transport planning.ORCID iD: 0000-0002-4945-3663
KTH, School of Architecture and the Built Environment (ABE), Civil and Architectural Engineering, Transport planning.ORCID iD: 0000-0003-1597-6738
Lund Univ, Div Transport & Rd, POB 118, S-22100 Lund, Sweden..
KTH, School of Architecture and the Built Environment (ABE), Civil and Architectural Engineering, Transport planning.ORCID iD: 0000-0001-5269-4356
2021 (English)In: Journal of Advanced Transportation, ISSN 0197-6729, E-ISSN 2042-3195, Vol. 2021, article id 3538462Article in journal (Refereed) Published
Abstract [en]

Shunting yards are one of the main areas impacting the reliability of rail freight networks, and delayed departures from shunting yards can further also affect the punctuality of mixed-traffic networks. Methods for automatic detection of departures, which are likely to be delayed, can therefore contribute towards increasing the reliability and punctuality of both freight and passenger services. In this paper, we compare the performance of tree-based methods (decision trees and random forests), which have been highly successful in a wide range of generic applications, in classifying the status of (delayed, early, and on-time) departing trains from shunting yards, focusing on the delayed departures as the minority class. We use a total number of 6,243 train connections (representing over 21,000 individual wagon connections) for a one-month period from the Hallsberg yard in Sweden, which is the largest shunting yard in Scandinavia. Considering our dataset, our results show a slight difference between the application of decision trees and random forests in detecting delayed departures as the minority class. To remedy this, enhanced sampling for minority classes is applied by the synthetic minority oversampling technique (SMOTE) to improve detecting and assigning delayed departures. Applying SMOTE improved the sensitivity, precision, and F-measure of delayed departures by 20% for decision trees and by 30% for random forests. Overall, random forests show a relative better performance in detecting all three departure classes before and after applying SMOTE. Although the preliminary results presented in this paper are encouraging, future studies are needed to investigate the computational performance of tree-based algorithms using larger datasets and considering additional predictors.

Place, publisher, year, edition, pages
Hindawi Limited , 2021. Vol. 2021, article id 3538462
National Category
Transport Systems and Logistics Computer Sciences
Identifiers
URN: urn:nbn:se:kth:diva-303061DOI: 10.1155/2021/3538462ISI: 000697297200001Scopus ID: 2-s2.0-85115798799OAI: oai:DiVA.org:kth-303061DiVA, id: diva2:1600663
Note

QC 20211005

Available from: 2021-10-05 Created: 2021-10-05 Last updated: 2023-05-17Bibliographically approved
In thesis
1. Application of Predictive Analytics for Shunting Yard Delays
Open this publication in new window or tab >>Application of Predictive Analytics for Shunting Yard Delays
2023 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]

Increasing the modal share of rail freight transport is one of the main ways to achieve carbon neutrality in Europe. The perceived low reliability and predictability of rail freight services is one of the main challenges to overcome in reaching this target. Shunting yards play an important role in providing more reliable and predictable freight trains. Shunting yard departure deviations impact other trains on mixed-traffic railway networks. Predictable departures from shunting yards increase the overall predictability of freight train runs along the network.

The primary focus of this thesis is on how to apply data-driven approaches to increase the predictability of shunting yard departures. Descriptive analytics were used to provide enhanced insight into shunting yard departures, and predictive analytics were applied to develop shunting yard departure deviation prediction models. Finally, hybrid modeling was used to integrate the yard departure prediction model with other simulation models for wider application. The results from this thesis contribute to providing a deeper understanding of shunting yard departure deviations, interactions between shunting yards and the network through departure and arrival deviations, and how to model these deviations by applying data-driven approaches. These results from five published research papers are included and presented in this doctoral thesis.

Descriptive analytics methods are applied in papers I and II to explore the probability distribution of departure deviations and the impact of the network on departure delays. The results show that positive and negative departure deviations have different distributions for different shunting yards. Moreover, network usage fluctuations over shorter timespans impact departure delays, whereas no correlation is established between network impact, defined as congestion in the arrival yard, and departure delays.

Predictive analytics is applied in paper III by developing tree-based algorithms to classify the status of shunting yard departures. The departure status are imbalanced; the majority are early, and the minority are delayed. The results show that applying methods to overcome imbalanced data sets can improve the prediction of delayed departures.

The models developed in paper III are extended in papers IV and V to predict departure deviations in a combined modeling approach for two separate applications. In paper IV, a machine learning-assisted macro simulation model framework is introduced to integrate yard departure predictions into a macro simulation network model and predict the arrivals to the next yard. The results show improved prediction accuracy compared to a basic machine learning model and a baseline timetable model.

Finally, in paper V, the generalization of the yard departure prediction model is explored by applying a simulation-assisted machine learning modeling approach where the model is trained on real-world European yard data and North American simulation yard data. The results show the model has a notable generalized performance with both data types.

Abstract [sv]

Ett av de huvudsakliga målen för att uppnå koldioxidneutralitet i Europa är att öka den modala andelen av godstransporter på järnväg. En av de stora utmaningarna är att övervinna uppfattningen om att godstrafik på järnväg har en låg tillförlitlighet och förutsägbarhet. Gods- och rangerbangårdar har en viktig roll i att tillhandahålla godståg med högre tillförlitlighet och förutsägbarhet. Avvikelser från godstågens planerade avgångstider från godsbangårdar påverkar i förlängningen andra tåg i järnvägsnätet. En högre förutsägbarhet vad gäller godstågens avgångstider från godsbangårdar innebär även en högre förutsägbarhet för tågens körning i nätverket.

Huvudfokus i avhandlingen är att tillämpa datadrivna metoder för att öka förutsägbarheten i godstågens avgångar från godsbangårdar. Deskriptiv analys har använts för att ge en ökad insikt över fördelningen av avgångar från godsbangårdar. Prediktiv analys har tillämpats för att utveckla prediktionsmodeller för avgångar. Slutligen används hybridmodellering för att integrera (koppla ihop) en prediktiv avgångsmodell med andra simuleringsmodeller för större tillämpningar. Doktorsavhandlingen omfattar fem publicerade forskningsartiklar från vilka resultaten presenteras.

I artikel I och II tillämpas deskriptiva analysmetoder för att undersöka sannolikhetsfördelningar för avgångsavvikelser och nätverkets inverkan på avgångsförseningar. Resultaten visar att fördelningar för positiva och negativa avvikelser skiljer sig mellan olika godsbangårdar.  Dessutom påverkar fluktuationer i nätverkets utnyttjandegrad inom kortare tidsperioder avgångsförseningarna. Däremot påvisas ingen korrelation mellan nätverkets påverkan, här definierat som trängsel på ankomstbangården, och avgångsförseningar.

I artikel III tillämpas prediktiv analys genom att utveckla trädbaserade algoritmer för att klassificera status/tillstånden för avgångarna från en godsbangård. Avgångsstatus/avgångstillstånden är obalanserade, en majoritet av tågen är tidiga och en minoritet är försenade. Resultaten visar att prediktionen av försenade avgångar kan förbättras genom att tillämpa metoder för att hantera obalans i data.

De modeller som utvecklats i artikel III utvecklas och utökas vidare i artikel IV och V för att prediktera avgångsavvikelser med en kombinerad modelleringsmetod för två olika tillämpningar. I artikel IV introduceras ett koncept med en maskininlärningsassisterad makrosimuleringsmodell med syftet att integrera avgångsprediktioner från en godsbangård i en makroskopisk nätverkssimuleringsmodell och prediktera godstågens ankomster till nästa godsbangård. Resultaten indikerar en förbättring i prediktionsnoggrannhet jämfört med en grundläggande maskininlärningsmodell och en baslinjemodell för tidtabell.

I artikel V undersöks generaliserbarheten av avgångsprediktionsmodellen genom att tillämpa en ansats med en simuleringsassisterad maskininlärningsmodell och där modellen tränas på verklig data från godsbangårdar i Europa och simuleringsdata från Nordamerika. Resultaten visar att modellens prestanda generellt är god med båda datatyperna.  

Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology, 2023. p. 62
Series
TRITA-ABE-DLT ; 2322
Keywords
Shunting yards, train delays, machine learning, simulation, freight transport, Godsbangårdar, tåg förseningar, maskininlärning, simulering, godstransport
National Category
Transport Systems and Logistics
Research subject
Transport Science, Transport Systems
Identifiers
urn:nbn:se:kth:diva-327021 (URN)978-91-8040-610-9 (ISBN)
Public defence
2023-06-15, Kollegiesalen, Brinellvägen 8, KTH Campus, video conference link: https://kth-se.zoom.us/j/69650875724, Stockholm, 13:00 (English)
Opponent
Supervisors
Projects
Shift2RailFR8HUBFR8RAIL IIIPRATA
Funder
Swedish Transport Administration
Note

QC 20230522

Available from: 2023-05-22 Created: 2023-05-17 Last updated: 2023-05-29Bibliographically approved

Open Access in DiVA

No full text in DiVA

Other links

Publisher's full textScopus

Authority records

Minbashi, NiloofarBohlin, MarkusKordnejad, Behzad

Search in DiVA

By author/editor
Minbashi, NiloofarBohlin, MarkusKordnejad, Behzad
By organisation
Transport planning
In the same journal
Journal of Advanced Transportation
Transport Systems and LogisticsComputer Sciences

Search outside of DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetric score

doi
urn-nbn
Total: 80 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf