Coarse-graining the cross-section: How Regression-via-Classification improves robustness in high-noise, small-sample-size domains such as cross-sectional asset pricing
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Grovkorniga tvärsnittet : Minska påverkan av brus i finansiell maskininlärning genom att binda svarsvariabeln i kvantiler (Swedish)
Abstract [en]
In the field of Quantitative Asset Pricing, the task of predicting expected asset returns stands as one of the hardest challenges due to the inherent complexities and uncertainties that lie in the evolving dynamics of financial markets. The prediction of expected returns is a central input parameter for the portfolio optimization problem, a constrained utility-maximization problem that lays the foundations of Portfolio construction. Traditional Machine Learning approaches to the field rely on regression models to predict expected stock returns, treating the problem as a continuous variable forecasting. However, the inherent small sample size of financial data combined with low signal-to-noise ratio, poses substantial difficulties for accurate forecasting. This thesis addresses these challenges by introducing a novel methodology – the application of a coarse-graining technique for the prediction of stock returns. Coarse-graining, commonly applied in statistical physics to simplify complex systems, involves grouping entities into broader categories. In the context of equity selection, this transforms the traditional regression problem - predicting the return of a stock - into a Regression-via-Classification one, predicting the quantile in which each stock is likely to reside within the market’s cross-section and then reverting it back to a continuous prediction through interpolation. The proposed approach of Regression-via-Classification has several motivations : by transforming a regression problem into a classification one, we prove theoretically that the task of classifying simplifies the task of estimating. Also, by categorizing stocks into quantiles we reduce the impact of outliers, extreme market fluctuations and shocks over time, providing a robust framework for prediction. This acknowledges the inherent uncertainty in financial markets and mitigates the noise present in financial time series data. Moreover, the coarse-grained classification facilitates the interpretability of model predictions, helping to discern patterns and trends within different segments of the market.
Abstract [sv]
Inom området för finansiell maskininlärning står uppgiften att välja aktier som en av de svåraste utmaningarna på grund av den inneboende komplexiteten och osäkerheten som ligger i den utvecklande dynamiken på finansmarknaderna. Traditionella tillvägagångssätt förlitar sig på regressionsmodeller för att förutsäga aktieavkastning, och behandlar problemet som en kontinuerlig variabel uppskattning. Den inneboende flyktiga karaktären hos finansiell data, summerad med ett extremt lågt signal-brusförhållande, ställer emellertid till stora svårigheter för korrekt prognostisering av en kontinuerlig variabel. Den här avhandlingen syftar till att ta itu med dessa utmaningar genom att introducera en ny metodik – tillämpningen av en grovkornig teknik för aktieavkastningsförutsägelser. Grovkornig, en teknik som vanligtvis används inom statistisk fysik för att förenkla komplexa system, innebär att data grupperas i bredare kategorier. I samband med aktieurval sker detta genom att omvandla det traditionella regressionsproblemet - att förutsäga avkastningen på en aktie - till en klassificering, som förutsäger den kvantil i vilken varje aktie sannolikt kommer att ligga inom marknadens tvärsnitt. Detta tillvägagångssätt erbjuder flera fördelar. För det första, genom att kategorisera aktier i kvantiler, minskar vi effekten av extremvärden och extrema marknadsfluktuationer och chocker, vilket ger ett tidsrobust ramverk för förutsägelse. För det andra erkänner den den inneboende osäkerheten på finansmarknaderna genom att anamma ett probabilistiskt perspektiv, bättre lämpat för att hantera det inneboende bruset som finns i finansiella tidsseriedata. Dessutom underlättar den grovkorniga klassificeringen tolkningen av modellförutsägelser, vilket hjälper till att urskilja mönster och trender inom olika segment av marknaden.
Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology , 2024. , p. 96
Series
TRITA-EECS-EX ; 2024:575
Keywords [en]
Stock Returns, Cross-section, Financial Machine Learning, Regression-via-Classification, Coarse-graining, Neural Network, Naive-Bayes
Keywords [sv]
Aktieavkastning, Tvärsnitt, Finansiell Maskininlärning, Regression-via-Klassificering, Grovkornig, Neuralt Nätverk, Naive-Bayes
National Category
Computer Sciences Computer Engineering
Identifiers
URN: urn:nbn:se:kth:diva-353033OAI: oai:DiVA.org:kth-353033DiVA, id: diva2:1896704
External cooperation
Ultramarin GmbH
Presentation
2024-07-02, via Zoom https://kth-se.zoom.us/j/62160281129, Isafjordsgatan 22 (Kistagången 16), Stockholm, 11:00 (English)
Supervisors
Examiners
2024-10-022024-09-102024-10-02Bibliographically approved