kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Dynamic User Grouping and Evolution Tracking (DUGET): Leveraging Machine Learning for Public Transit Insights
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Dynamisk Användargruppering och Utvecklingsspårning (DUGET) : Utnyttja Maskininlärning för Insikter om Kollektivtrafik (Swedish)
Abstract [en]

The concept of clustering involves identifying and grouping similar objects, distinguishing them from dissimilar items in other groups. Over time, these groups or individual objects can change. Tracking this change can provide more detailed insights compared to analyzing data in aggregate. Clustering can reveal groups of objects that are more or less affected, yet there is currently no clear framework for this. This study analyzes how data mining can be applied to travel patterns from a public transportation dataset in Stockholm, Sweden. The objective is to propose a generalizable model for future projects aimed at understanding trends in groups of objects. The results demonstrate a methodology where objects were first represented by their temporal travel patterns and clustered using a multi-step approach. These clusters were then tracked over time using Jaccard similarity based on memberships, allowing for the analysis and visualization of changes over time. This model shows the feasibility of tracking change over time in the domain of public transportation by examining user behavior as a temporal aggregate. Future research could explore its flexibility in different data types and representations.

Abstract [sv]

Idén med klustring är att gruppera objekt som är mer lika varandra inom samma grupp än objekt från andra grupper. Över tid så kan dessa grupper eller individuella objekt förändras och spårning av denna förändring kan ge en mer detaljerad inblick. Genom att kolla på specifika förändringar så kan det vara möjligt att identifiera grupper av objekt som är mer eller mindre påverkade. Det finns för tillfället ingen tydlig metodik för att göra just detta. En analys av hur datautvinning kan appliceras på resemönster från data inom kollektivtrafik i regionen Stockholm, Sverige görs. Denna analys kan visa hur en generaliserbar modell för framtida projekt för en mer detaljerad förståelse av trender kan se ut. Resultaten visar hur en modell kan först representera resenärer som en aggregering av deras resemönster och bygga upp grupper utifrån en multistegsklustring. Dessa grupper blir länkade över tid till andra grupper via gruppmedlemskap där snittet över unionen används. Grupperna kan sedan analyseras och visualiseras jämfört med de mest lika grupperna utifrån gruppmedlemskap. Den föreslagna metoden för att spåra förändringar över tid visar sig vara applicerbar på resedata från kollektivtrafiken i Region Stockholm, Sverige. Framtida projekt kan fokusera på att visa hur flexibel modellen är och vilka typer av data och konfigurationer som kan användas.

Place, publisher, year, edition, pages
2024. , p. 96
Series
TRITA-EECS-EX ; 2024:592
Keywords [en]
Clustering Algorithms, Public Transportation, User Behavior, Evolving Clusters, Cluster Tracking
Keywords [sv]
Klustrings Algoritmer, Kollektivtrafik, Användarbeteende, Kluster Utveckling, Kluster Spårning
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-353078OAI: oai:DiVA.org:kth-353078DiVA, id: diva2:1897040
External cooperation
Trafikförvaltningen
Supervisors
Examiners
Available from: 2024-10-02 Created: 2024-09-11 Last updated: 2024-10-02Bibliographically approved

Open Access in DiVA

fulltext(2779 kB)212 downloads
File information
File name FULLTEXT01.pdfFile size 2779 kBChecksum SHA-512
40c703efcbf3e8d994c1c5979707b7dedb0719eb1c85553de76e87f76bf5546a140527cc96262a8169f1af9769de25704f12d36a0c2d28dbbf593fddc26d2228
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 212 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 214 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf