kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Revealing representative day-types in transport networks using traffic data clustering
KTH, Skolan för arkitektur och samhällsbyggnad (ABE), Byggvetenskap, Transportplanering. (Urban mobility group)ORCID-id: 0000-0002-8499-0843
KTH, Skolan för arkitektur och samhällsbyggnad (ABE), Byggvetenskap, Transportplanering. KTH, Skolan för arkitektur och samhällsbyggnad (ABE), Centra, Centrum för transportstudier, CTS.ORCID-id: 0000-0002-4106-3126
Linköping university.
KTH, Skolan för arkitektur och samhällsbyggnad (ABE), Byggvetenskap, Transportplanering.ORCID-id: 0000-0003-1514-6777
(Engelska)Manuskript (preprint) (Övrigt vetenskapligt)
Abstract [en]

Recognition of spatio-temporal traffic patterns at the network-wide level plays an important role in data-driven intelligent transport systems (ITS) and is a basis for applications such as short-term prediction and scenario-based traffic management. Common practice in the transport literature is to rely on well-known general unsupervised machine-learning methods (e.g., k-means, hierarchical, spectral, DBSCAN) to select the most representative structure and number of day-types based solely on internal evaluation indices. These are easy to calculate but are limited since they only use information in the clustered dataset itself. In addition, the quality of clustering should ideally be demonstrated by external validation criteria, by expert assessment or the performance in its intended application. The main contribution of this paper is to test and compare the common practice of internal validation with external validation criteria represented by the application to short-term prediction, which also serves as a proxy for more general traffic management applications. When compared to external evaluation using short-term prediction, internal evaluation methods have a tendency to underestimate the number of representative day-types needed for the application. Additionally, the paper investigates the impact of using dimensionality reduction. By using just 0.1\% of the original dataset dimensions, very similar clustering and prediction performance can be achieved, with up to 20 times lower computational costs, depending on the clustering method. K-means and agglomerative clustering may be the most scalable methods, using up to 60 times fewer computational resources for very similar prediction performance to the p-median clustering.

Nyckelord [en]
lustering, network-wide, day clustering, cluster validity, external indices, internal indices, prediction, dimensionality reduction
Nationell ämneskategori
Transportteknik och logistik
Forskningsämne
Transportvetenskap, Transportsystem; Transportvetenskap
Identifikatorer
URN: urn:nbn:se:kth:diva-304729OAI: oai:DiVA.org:kth-304729DiVA, id: diva2:1610237
Anmärkning

QC 20211116

Tillgänglig från: 2021-11-10 Skapad: 2021-11-10 Senast uppdaterad: 2022-06-25Bibliografiskt granskad
Ingår i avhandling
1. Enhancing Short-Term Traffic Prediction for Large-Scale Transport Networks by Spatio-Temporal Clustering
Öppna denna publikation i ny flik eller fönster >>Enhancing Short-Term Traffic Prediction for Large-Scale Transport Networks by Spatio-Temporal Clustering
2021 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

Congestion in large cities is responsible for extra travel time, noise, air pollution, CO2 emissions, and more. Transport is one of the main recognized contributors to global warming and climate change, which is getting increasing attention from authorities and societies around the world. Better utilization of existing resources by Intelligent Transport Systems (ITS) and digital technologies are recognized by the European Commission as technologies with enormous potential to lower the negative impacts associated with high traffic volumes in urban areas.

The main focus of this work is on short-term traffic prediction, which is an essential tool in ITS. In combination with providing information, it enables proactive decisions to decrease severity of congestion that occurs regularly or is caused by incidents. The main contribution of this work is to develop a methodological framework and prove its enhancing effects on short-term prediction in the context of large-scale transport networks. It is expected to contribute to more robust and accurate predictions of ITS in traffic management centers.

Traffic patterns in large-scale networks, including urban streets, can be heterogeneous during the day and from day-to-day. This work investigates spatio-temporal clustering of heterogeneous data sets to smaller, more homogeneous data sub-sets. This is expected to produce more robust, accurate, scalable, and cost-effective prediction models. 

This thesis is the collection of five papers that contribute to enhancing short-term traffic prediction in this context. The clustering is recognized to boost prediction performance in Papers II, III, IV, and V. Paper II considers network partitioning and the last three papers study day clustering. The prediction models used across included papers are naive historical mean prediction models and more advanced prediction models such as probabilistic principal component analysis (PPCA) and exponential smoothing. Paper I considers and facilitates floating car data (FCD) as a cost-effective opportunistic source of speed and travel time data with extensive network coverage.

Common practice in determining the number of clusters is to rely on internal evaluation indices, and these are very efficient but isolated from application. Paper IV tests this practice by also considering performance in short-term prediction application. Our results show that relying on these indices can lead to a loss of prediction accuracy of about 20% depending on the considered prediction model. Dimensionality reduction has a minimal effect on the resulting prediction performance, but clustering needs 20 times less computational time and only 0.1% of the original information.

Finally, in Paper V, we look at similarities of representative day clusters recognized by speed and flows. Furthermore, the interchangeability of speed day-type centroids for flow when predicting speeds has proven to be robust, which is not a case for predicting flows by speed day-type centroids and observations.

Abstract [sv]

Trängsel i storstäderna leder till extra restid, buller, luftföroreningar, koldioxidutsläpp med mera. Transporter är en av de främsta erkända bidragsgivarna till global uppvärmning och klimatförändringar, som får allt större uppmärksamhet från myndigheter och samhällen runt om i världen. Bättre utnyttjande av befintliga resurser genom intelligenta transportsystem (ITS) och digital teknik identifieras av Europeiska kommissionen som teknik med en enorm potential att minska ovanstående negativa effekter kopplade till stora trafikvolymer i stadsområden.

Huvudfokus i detta arbete ligger påkortsiktiga trafikprognoser, som är ett viktigt verktyg inom ITS. I kombination med informationsförsörjning möjliggör de proaktiva beslut för att minska omfattningen av trafikstockningar som uppstår regelbundet eller orsakas av incidenter. Det viktigaste bidraget i detta arbete är att utveckla ett metodologiskt ramverk och bevisa dess förbättrande effekter påkortsiktiga prognoser för storskaliga transportnät. Det förväntas bidra till mer robusta och exakta prognoser av ITS i trafikledningscentraler.

Trafikmönster i storskaliga nät, inklusive stadsgator, kan vara heterogena under dagen och från dag till dag. I detta arbete undersöks rumslig och temporal klustring av heterogena datamängder till mindre, mer homogena datamängder. Detta förväntas ge mer robusta, exakta, skalbara och kostnadseffektiva prognosmodeller.

Avhandlingen är en samling av fem artiklar som bidrar till att förbättra kortsiktiga trafikprognoser i detta sammanhang. Klustring påvisas öka prediktionsprestandan i artiklar II, III, IV och V. I artikel II beaktas nätverksuppdelning och i de tre sista dokumenten klusterbildning. De prediktionsmodeller som används i de inkluderade artiklarna är naiva historiska medelvärdesprediktionsmodeller och mer avancerade parametriska prediktionsmodeller, t.ex. probabilistisk principalkomponentanalys (PPCA) och exponentiell utjämning. I artikel I beaktas och utnyttjas probfordonsdata (FCD) som en kostnadseffektiv opportunistisk källa till hastighets- och restidsdata med omfattande nätverkstäckning.

Den vedertagna metoden för att bestämma antalet kluster är att förlita sig påinterna utvärderingsindex, och dessa är mycket effektiva men isolerade från tillämpningen. I uppsats IV testas denna praxis genom att även beakta prestandan i en tillämpning för korttidsprognoser. Våra resultat visar att om man förlitar sig pådessa index kan det leda till en förlust av prediktionsprestanda påcirka 20% beroende påvilken prognosmodell som används. Dimensionalitetsminskning har en minimal effekt påden resulterande prediktionsprestandan, men klusterbildning kräver 20 gånger mindre beräkningstid och endast 0,1% av den ursprungliga informationen.

Slutligen undersöker vi i artikel V likheterna mellan representativa dagskluster som bildas genom hastighet respektive flöden. Dessutom visar sig utbytbarheten av dagstypcentroider från hastigheter till flöden robust vid prediktion av hastigheter , vilket inte är fallet när det gäller prediktion av flöden.

Ort, förlag, år, upplaga, sidor
Stockholm, Sweden: KTH Royal Institute of Technology, 2021. s. 58
Serie
TRITA-ABE-DLT ; 2143
Nyckelord
short-term prediction, clustering, spatio-temporal clustering, day-types, speed-flow relationship, large-scale
Nationell ämneskategori
Transportteknik och logistik
Forskningsämne
Transportvetenskap, Transportsystem
Identifikatorer
urn:nbn:se:kth:diva-304732 (URN)978-91-8040-071-8 (ISBN)
Disputation
2021-12-09, F3, Lindstedsvägen 26, KTH Campus, Zoom: https://kth-se.zoom.us/j/66844011086, Stockholm, 13:00 (Engelska)
Opponent
Handledare
Tillgänglig från: 2021-11-15 Skapad: 2021-11-10 Senast uppdaterad: 2022-09-19Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Person

Cebecauer, MatejJenelius, ErikBurghout, Wilco

Sök vidare i DiVA

Av författaren/redaktören
Cebecauer, MatejJenelius, ErikBurghout, Wilco
Av organisationen
TransportplaneringCentrum för transportstudier, CTS
Transportteknik och logistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 228 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf