A comparison of LSTM and ARIMA forecasting of the stock market
2024 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesisAlternative title
En jämförande analys mellan LSTM och ARIMA’s förmåga att prognotisera aktiemarknaden (Swedish)
Abstract [en]
The digitisation enables forecasting methods using large amounts of data. This includes forecasts of intricate systems such as stock markets. Autoregressive Integrated Moving Average (ARIMA) is a statistical forecast method that has been a commonly used tool for time series forecasting. As the world becomes digitised, machine learning models such as Long Short-Term Memory (LSTM) emerge as an alternative. The purpose of this thesis is to asses the predictive ability of ARIMA in comparison to LSTM. The goal is to aid investors in their choice of a forecasting tool. Therefore, the research question is which forecasting tool has the least error when predicting the adjusted closing price of the Stockholm market index, OMX Stockholm 30 (OMXS30), for periods of 7 days, 30 days and 60 days. The research is qualitative on quantitative data and descriptive. A literature study is conducted on financial analysis and machine learning. An ARIMA and a LSTM model are implemented according to the current principles for time series forecasting. The models are evaluated by comparing the error for each period and model using root mean square error (RMSE) and mean absolute error (MAE). The result indicate that the models have a similar predictive ability for a 7-day period. For a period of 30 days, the LSTM generates results with smaller error in contrast to ARIMA. For a 60-day period, ARIMA generates results with smaller error while LSTM does not forecast satisfactorily. In both cases, the results can potentially be improved with tuning of the models parameters.
Abstract [sv]
Digitaliseringen har möjliggjort prognosmetoder som använder stora mängder data. Detta inkluderar prognoser av komplexa system såsom aktiemarknader. Autoregressive Integrated Moving Average (ARIMA) är en statistisk metod som har varit ett vanligt verktyg för tidsserieanalys. I och med digitaliseringen har maskininlärningsmodeller som Long Short-Term Memory (LSTM) dykt upp som ett alternativ. Syftet med denna uppsats är att bedöma den prediktiva förmågan hos ARIMA jämfört med LSTM. Målet är att hjälpa investerare i deras val av prognosverktyg. Därför är frågeställnigen vilket prognosverktyg förutser det justerade slutpriset för Stockholms marknadsindex, OMX Stockholm 30 (OMXS30), med minst fel. Detta utvärderas för perioder på 7 dagar, 30 dagar och 60 dagar. Undersökningen är av kvalitativ karaktär baserad på kvantitativ data. En litteraturstudie genomfördes på finansiell analys och maskininlärning. En ARIMA- och en LSTM-modell implementerades enligt rådande praxis för tidsserieanalys. Modellerna utvärderades genom att jämföra felet för varje period och modell med hjälp av root mean square error (RMSE) och mean absolute error (MAE). Resultatet indikerar att modellerna har en liknande prediktiv förmåga för en 7-dagars period. För en period på 30 dagar genererar LSTM resultat med mindre fel i kontrast till ARIMA. För en 60- dagars period genererar ARIMA resultat med mindre fel medan LSTM inte förutspår tillfredsställande. I båda fallen skulle resultaten potentiellt kunna förbättras genom justering av parametrar i modellerna.
Place, publisher, year, edition, pages
2024. , p. 39
Series
TRITA-EECS-EX ; 2024:864
Keywords [en]
Machine Learning, Stock Market, Stock Price Forecasting, Long Short-Term Memory, Autoregressive Integrated Moving Average
Keywords [sv]
Maskininlärning, Aktiemarknaden, Aktieprognostisering, Long Short-Term Memory, Autoregressive Integrated Moving Average
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-360831OAI: oai:DiVA.org:kth-360831DiVA, id: diva2:1942061
Supervisors
Examiners
2025-03-072025-03-042025-03-07Bibliographically approved