Dynamic User Grouping and Evolution Tracking (DUGET): Leveraging Machine Learning for Public Transit Insights
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Dynamisk Användargruppering och Utvecklingsspårning (DUGET) : Utnyttja Maskininlärning för Insikter om Kollektivtrafik (Swedish)
Abstract [en]
The concept of clustering involves identifying and grouping similar objects, distinguishing them from dissimilar items in other groups. Over time, these groups or individual objects can change. Tracking this change can provide more detailed insights compared to analyzing data in aggregate. Clustering can reveal groups of objects that are more or less affected, yet there is currently no clear framework for this. This study analyzes how data mining can be applied to travel patterns from a public transportation dataset in Stockholm, Sweden. The objective is to propose a generalizable model for future projects aimed at understanding trends in groups of objects. The results demonstrate a methodology where objects were first represented by their temporal travel patterns and clustered using a multi-step approach. These clusters were then tracked over time using Jaccard similarity based on memberships, allowing for the analysis and visualization of changes over time. This model shows the feasibility of tracking change over time in the domain of public transportation by examining user behavior as a temporal aggregate. Future research could explore its flexibility in different data types and representations.
Abstract [sv]
Idén med klustring är att gruppera objekt som är mer lika varandra inom samma grupp än objekt från andra grupper. Över tid så kan dessa grupper eller individuella objekt förändras och spårning av denna förändring kan ge en mer detaljerad inblick. Genom att kolla på specifika förändringar så kan det vara möjligt att identifiera grupper av objekt som är mer eller mindre påverkade. Det finns för tillfället ingen tydlig metodik för att göra just detta. En analys av hur datautvinning kan appliceras på resemönster från data inom kollektivtrafik i regionen Stockholm, Sverige görs. Denna analys kan visa hur en generaliserbar modell för framtida projekt för en mer detaljerad förståelse av trender kan se ut. Resultaten visar hur en modell kan först representera resenärer som en aggregering av deras resemönster och bygga upp grupper utifrån en multistegsklustring. Dessa grupper blir länkade över tid till andra grupper via gruppmedlemskap där snittet över unionen används. Grupperna kan sedan analyseras och visualiseras jämfört med de mest lika grupperna utifrån gruppmedlemskap. Den föreslagna metoden för att spåra förändringar över tid visar sig vara applicerbar på resedata från kollektivtrafiken i Region Stockholm, Sverige. Framtida projekt kan fokusera på att visa hur flexibel modellen är och vilka typer av data och konfigurationer som kan användas.
Place, publisher, year, edition, pages
2024. , p. 96
Series
TRITA-EECS-EX ; 2024:592
Keywords [en]
Clustering Algorithms, Public Transportation, User Behavior, Evolving Clusters, Cluster Tracking
Keywords [sv]
Klustrings Algoritmer, Kollektivtrafik, Användarbeteende, Kluster Utveckling, Kluster Spårning
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-353078OAI: oai:DiVA.org:kth-353078DiVA, id: diva2:1897040
External cooperation
Trafikförvaltningen
Supervisors
Examiners
2024-10-022024-09-112024-10-02Bibliographically approved