kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Predicting and Measuring Retail Activity in Stock Markets: A Binary Classification Approach at Nasdaq Stockholm
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Prediktion och mätning av privatkundshandelsaktivitet på aktiemarknader : En binär klassificeringsmetod på Nasdaq Stockholm (Swedish)
Abstract [en]

This thesis explores the challenge of accurately predicting and classifying retail order flow in stock markets, using Nasdaq Stockholm as a case study. Retail order flow refers to the subset of stock market transactions initiated by individual investors as opposed to institutional ones. Understanding the nuances of this flow is vital as it can significantly influence market dynamics. Despite the extensive literature on market prediction using various data sources, few studies have specifically isolated and analyzed the characteristics of retail activities using machine learning. The complexity and lack of focus on this area in previous research was the primary motivation to carry out this thesis, given the sophisticated data analysis and machine learning techniques required. Our approach utilized a binary classification system leveraging state-of-the-art machine learning models including Logistic Regression, Random Forest, AdaBoost, Recurrent Neural Networks, and Long Short-Term Memory. We also engaged in data preprocessing to manage issues such as outliers and imbalanced datasets. Our results demonstrate potential for the applied models to discriminate effectively between retail and non-retail order flows, with the ensemble and deep learning models showing particularly promising performance. The successful classification model not only provides Nasdaq with a tool to better understand and predict market behaviors but also contributes to academic discussions about the dynamics of market participants. Future researchers and market analysts can build on these findings to develop better market models. By identifying the distinct behaviors and impacts of retail investors, this thesis fills a notable gap in existing financial literature and provides a robust framework for further exploration and application in real-world scenarios.

Abstract [sv]

Denna avhandling undersöker utmaningen med att förutsäga och klassificera privatkundhandelns orderflöden på aktiemarknader, med Nasdaq Stockholm som fallstudie. Privatkundhandels orderflöde avser de transaktioner på aktiemarknaden som initieras av privata aktörer, till skillnad från institutionella aktörer. Förståelsen av detaljerna i detta flöde kan vara viktigt för att precist kartlägga marknadsdynamiken. Trots en omfattande mängd litteratur om marknadsprediktioner med hjälp av olika datakällor, har få studier specifikt isolerat och analyserat karaktärsdragen hos privatkundshandeln med användning av maskininlärning. Komplexiteten och det tidigare forskningens bristande fokus på detta område var huvudorsaken till genomförandet av denna avhandling, med tanke på de avancerade dataanalys- och maskininlärningstekniker som krävs. Vår metodik använde ett binärt klassificeringssystem som applicerar moderna maskininlärningsmodeller, inklusive Logistic Regression, Random Forest, AdaBoost, Recurrent Neural Networks och Long Short-Term Memory. Vi genomförde även bearbetning av data för att hantera problem som avvikande värden och obalanserade dataset. Resultaten visar att de applicerade modellerna har potential att effektivt skilja mellan privatkunder samt icke-privatkunder från orderflöden, där både ensemble- och djupinlärningsmodellerna visade särskilt lovande prestanda. Den framgångsrika klassificeringsmodellen ger inte bara Nasdaq ett verktyg för att bättre förstå och förutsäga marknadsbeteenden, utan bidrar även till akademiska diskussioner om dynamiken mellan investerare i marknaden. Framtida forskare och marknadsanalytiker kan bygga vidare på detta resultat för att utveckla bättre marknadsmodeller. Genom att identifiera de unika beteendena och påverkan från privata investerare fyller denna avhandling en märkbar lucka i den befintliga finansiella litteraturen och erbjuder ett robust ramverk för fortsatt utforskning och tillämpning.

Place, publisher, year, edition, pages
2024. , p. 56
Series
TRITA-EECS-EX ; 2024:663
Keywords [en]
Retail trading, Order flow classification, Machine learning, Deep learning, Stock market analysis, Financial market dynamics, Binary classification, Logistic Regression, AdaBoost, Random Forest, Recurrent Neural Network, Long Short-Term Memory
Keywords [sv]
Privatkundshandel, Klassificering av orderflöden, Maskininlärning, Djupinlärning, Aktiemarknadsanalys, Dynamik på finansmarknaden, Binär klassificering, Logistic Regression, AdaBoost, Random Forest, Recurrent Neural Network, Long Short-Term Memory
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-354550OAI: oai:DiVA.org:kth-354550DiVA, id: diva2:1903933
External cooperation
Nasdaq AB
Supervisors
Examiners
Available from: 2025-01-20 Created: 2024-10-07 Last updated: 2025-01-20Bibliographically approved

Open Access in DiVA

fulltext(514 kB)71 downloads
File information
File name FULLTEXT01.pdfFile size 514 kBChecksum SHA-512
afcc36dcbda06ec8ce89630858c567c21bdb38a461ffce3364ab7b53900e4aa043d89d20a626d844e243654bc0350b0a0fe7ce0aa99f10cf7beed78c48232396
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 71 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 474 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf