Classification of Traffic Conditions in Urban Traffic Data: A Comparative Study of Deep Learning Approaches
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Klassificering av trafikförhållanden i vägtrafikdata : En jämförande studie av djupa inlärningsmetoder (Swedish)
Abstract [en]
In urban cities, road measurements are often conducted using pneumatic tubes collecting time series data on vehicle counts, types, and speeds, at different locations and times. This data can capture unwanted traffic conditions such as congestion, which is a vital indicator of changes in urban traffic dynamics and road conditions. For traffic analysists, manual efforts is often required to analyze and classify various traffic states in the data, which poses a problem due to its inherent inefficiency. To address this, this thesis compares two supervised deep learning models to classify time series of traffic data into three classes: normal traffic, congested traffic, and traffic with a large presence of heavy vehicles such as trucks. The two models under investigation are a long short-term memory neural network (LSTM) and a fully convolutional neural network (FCNN). They were selected for their popularity and state- of-the-art performance for time series classification. The models are trained and evaluated on four datasets with time series of specific temporal lengths (5 minutes, 10 minutes, 15 minutes, or 20 minutes) to investigate the impact of sequence lengths on model performance. Evaluation metrics include test accuracy, macro-average Precision, Recall, F1-score, and confusion matrices. Results show that the FCNN outperforms the LSTM, achieving accuracy scores above 97%, and exhibits more efficient learning. LSTM accuracies range from 85% to 95%. The FCNN performs better on longer sequences, while the LSTM performs better on shorter sequences. Further analysis demonstrates that the choice of model, both independently and in combination with temporal length, affects accuracy. However, the temporal length factor alone does not significantly impact accuracy. Applying deep learning models on vehicle traffic data in the form of time series is a novel area of research. Previous studies have mostly explored image data. This study provides several insights in this field and highlights the potential of employing deep learning for traffic condition classification. However, additional research is advocated to validate the results and address identified issues.
Abstract [sv]
I storstäder utförs ofta trafikmätningar med luftslangar runt olika platser och tider som samlar in tidsseriedata om antal fordon, typer och hastigheter. Denna data kan fånga oönskade trafikförhållanden som köbildning, vilket är en viktig indikator på förändringar i trafikens dynamik och vägförhållanden. Det krävs ofta manuella insatser av analytiker för att analysera och klassificera olika typer av trafikförhållanden som fångas i datan, vilket utgör ett problem på grund av dess ineffektivitet. I detta examensarbete jämförs två övervakade djupinlärdningsmodeller för klassificering av trafikdata i form a tidsserier av följande klasser (trafiktillstånd): normal trafik, köbildning, samt trafik med hög förekomst av tunga fordon såsom lastbilar. Modellerna som undersöks är ett “Long Short-Term Memory’’ neuralt nätverk (LSTM) och ett “Fully Convolutional’’ neuralt nätverk (FCNN). Dessa modeller är utvalda för deras popularitet och state-of-the-art prestanda i klassificering av tidsserier. Modellerna tränas och utvärderas på fyra datamängder med tidsserier som sträcker sig över specifika tidsintervall (5 minuter, 10 minuter, 15 minuter eller 20 minuter) för att undersöka effekten av sekvenslängd på modellens prestanda. Utvärderingen utnyttjar mått så som testnoggrannhet, genomsnittlig Precision, Recall, F1-poäng och “confusion matrix’’. Resultaten visar att FCNN presterar bättre än LSTM och uppvisar en träffsäkerhet på över 97% samt tecken på effektivare inlärning. Noggrannheten hos LSTM-modellen sträcker sig från 85% till 95%. FCNN presterar bättre på längre sekvenser medan LSTM presterar bättre på kortare sekvenser. Vidare analyser visar att det finns statistiskt bevis för att valet av modell, både oberoende och i kombination med tidslängd, påverkar noggrannheten. Dock påverkar tidslängdsfaktorn inte noggrannheten signifikant på egen hand. Denna studie ger flera insikter inom detta forskningsområde och belyser potentialen i att använda djupinlärning för klassificering av trafiktillstånd. Ytterligare forskning förespråkas för att validera resultaten och adressera identifierade problem.
Place, publisher, year, edition, pages
2024. , p. 45
Series
TRITA-EECS-EX ; 2024:791
Keywords [en]
Time-series classification, Deep learning, LSTM, CNN, Artificial neural networks, Supervised learning, Urban traffic analysis
Keywords [sv]
Klassificering av tidsserier, Djupinlärning, LSTM, CNN, Artificiella neurala nätverk, Väglett lärande, Analysering av stadstrafik
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-360229OAI: oai:DiVA.org:kth-360229DiVA, id: diva2:1939076
External cooperation
Norconsult Digital AB
Supervisors
Examiners
2025-02-252025-02-202025-02-25Bibliographically approved