kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Coarse-graining the cross-section: How Regression-via-Classification improves robustness in high-noise, small-sample-size domains such as cross-sectional asset pricing
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Grovkorniga tvärsnittet : Minska påverkan av brus i finansiell maskininlärning genom att binda svarsvariabeln i kvantiler (Swedish)
Abstract [en]

In the field of Quantitative Asset Pricing, the task of predicting expected asset returns stands as one of the hardest challenges due to the inherent complexities and uncertainties that lie in the evolving dynamics of financial markets. The prediction of expected returns is a central input parameter for the portfolio optimization problem, a constrained utility-maximization problem that lays the foundations of Portfolio construction. Traditional Machine Learning approaches to the field rely on regression models to predict expected stock returns, treating the problem as a continuous variable forecasting. However, the inherent small sample size of financial data combined with low signal-to-noise ratio, poses substantial difficulties for accurate forecasting. This thesis addresses these challenges by introducing a novel methodology – the application of a coarse-graining technique for the prediction of stock returns. Coarse-graining, commonly applied in statistical physics to simplify complex systems, involves grouping entities into broader categories. In the context of equity selection, this transforms the traditional regression problem - predicting the return of a stock - into a Regression-via-Classification one, predicting the quantile in which each stock is likely to reside within the market’s cross-section and then reverting it back to a continuous prediction through interpolation. The proposed approach of Regression-via-Classification has several motivations : by transforming a regression problem into a classification one, we prove theoretically that the task of classifying simplifies the task of estimating. Also, by categorizing stocks into quantiles we reduce the impact of outliers, extreme market fluctuations and shocks over time, providing a robust framework for prediction. This acknowledges the inherent uncertainty in financial markets and mitigates the noise present in financial time series data. Moreover, the coarse-grained classification facilitates the interpretability of model predictions, helping to discern patterns and trends within different segments of the market.

Abstract [sv]

Inom området för finansiell maskininlärning står uppgiften att välja aktier som en av de svåraste utmaningarna på grund av den inneboende komplexiteten och osäkerheten som ligger i den utvecklande dynamiken på finansmarknaderna. Traditionella tillvägagångssätt förlitar sig på regressionsmodeller för att förutsäga aktieavkastning, och behandlar problemet som en kontinuerlig variabel uppskattning. Den inneboende flyktiga karaktären hos finansiell data, summerad med ett extremt lågt signal-brusförhållande, ställer emellertid till stora svårigheter för korrekt prognostisering av en kontinuerlig variabel. Den här avhandlingen syftar till att ta itu med dessa utmaningar genom att introducera en ny metodik – tillämpningen av en grovkornig teknik för aktieavkastningsförutsägelser. Grovkornig, en teknik som vanligtvis används inom statistisk fysik för att förenkla komplexa system, innebär att data grupperas i bredare kategorier. I samband med aktieurval sker detta genom att omvandla det traditionella regressionsproblemet - att förutsäga avkastningen på en aktie - till en klassificering, som förutsäger den kvantil i vilken varje aktie sannolikt kommer att ligga inom marknadens tvärsnitt. Detta tillvägagångssätt erbjuder flera fördelar. För det första, genom att kategorisera aktier i kvantiler, minskar vi effekten av extremvärden och extrema marknadsfluktuationer och chocker, vilket ger ett tidsrobust ramverk för förutsägelse. För det andra erkänner den den inneboende osäkerheten på finansmarknaderna genom att anamma ett probabilistiskt perspektiv, bättre lämpat för att hantera det inneboende bruset som finns i finansiella tidsseriedata. Dessutom underlättar den grovkorniga klassificeringen tolkningen av modellförutsägelser, vilket hjälper till att urskilja mönster och trender inom olika segment av marknaden.

Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology , 2024. , p. 96
Series
TRITA-EECS-EX ; 2024:575
Keywords [en]
Stock Returns, Cross-section, Financial Machine Learning, Regression-via-Classification, Coarse-graining, Neural Network, Naive-Bayes
Keywords [sv]
Aktieavkastning, Tvärsnitt, Finansiell Maskininlärning, Regression-via-Klassificering, Grovkornig, Neuralt Nätverk, Naive-Bayes
National Category
Computer Sciences Computer Engineering
Identifiers
URN: urn:nbn:se:kth:diva-353033OAI: oai:DiVA.org:kth-353033DiVA, id: diva2:1896704
External cooperation
Ultramarin GmbH
Presentation
2024-07-02, via Zoom https://kth-se.zoom.us/j/62160281129, Isafjordsgatan 22 (Kistagången 16), Stockholm, 11:00 (English)
Supervisors
Examiners
Available from: 2024-10-02 Created: 2024-09-10 Last updated: 2024-10-02Bibliographically approved

Open Access in DiVA

fulltext(2028 kB)116 downloads
File information
File name FULLTEXT01.pdfFile size 2028 kBChecksum SHA-512
5e2fa44c7909afa2156f254d5be376e0a13fd32aafdf1a67809ecea1632ae7aaef81caafb97ad99970c03a16ca650e8b363fc66b158ad7687e4bfbba2640d183
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer SciencesComputer Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 116 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 112 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf