kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Enhancing House Rental Price Prediction Models for the Swedish Market: Exploring External features, Prediction intervals and Uncertainty Management in Predicting House Rental Prices
KTH, School of Electrical Engineering and Computer Science (EECS).
2023 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Förbättra hushyresprisprognoser för den svenska marknaden : Utforska externa funktioner, prediktionsintervall och Osäkerhetshantering i Predicting House Hyrespriser (Swedish)
Abstract [sv]

Exakt förutsägelse av hyrespriserna för hus är ett avgörande problem i verkligheten fastighetsdomän, vilket underlättar informerat beslutsfattande för både hyresgäster och hyresvärdar. Denna studie presenterar en omfattande utforskning av olika maskininlärningstekniker som tillämpas på en mångsidig datauppsättning av husfunktioner, med det övergripande målet att avslöja den mest effektiva algoritmen för förutsäga hyrespriser. Genom rigorösa experimenterande och noggranna analys, strävar vi efter att ge insikter om styrkor, begränsningar och praktiska implementeringsmöjligheter för olika modeller inom dynamiken förutsägelser om husuthyrning. Att träna effektiva modeller relevanta funktioner extraheras från databasen och olika funktionsteknikmetoder är utförs som kan vara avgörande för att förbättra modellens kvalitet. Uppgifterna som användes i studien baserades på undertecknade huskontrakt och osignerade hus ansökningar inkomna på onlinebostadsplattformen Qasa. Studien analyserar den prediktiva förmågan hos XGBoost- och CatBoost-modellerna. Senare hyperparameterinställning gav betydande förbättringar, med lägre RMSE poäng. Extern funktion som eventuellt kan påverka priset på hyran som promenadpoäng, polarkoordinater och räntor ingår i dataset från tredje parts API:er. Studien visar att lägga till dessa funktioner introducerar komplexitet, vilket leder till både marginella ökningar av baslinjemodeller RMSE-värden och betydande förbättringar efter justering av hyperparameter. Vår undersökningen omfattar också konstruktion och analys av förutsägelser intervaller som förutsäger möjliga hyresintervall, vilket understryker vikten av fångar verklig osäkerhet korrekt. Utförandet av tre olika metoder för att beräkna prediktionsintervall analyseras och jackkniven plus-metoden uppnår konsekvent de högsta täckningspoängen, vilket indikerar dess förmåga att exakt fånga verkliga observationsområden. Avhandlingen undersöker hur kombinationen av ett dataset med viss hyra värden och en datauppsättning med osäkra hyresvärden kan införlivas i byggnaden en prisprediktionsmodell. Olika tillvägagångssätt såsom källinformation särdragsmetod , tillvägagångssätt för säkerheten, aggregerade egenskapsegenskaper, och KNN-baserad tillvägagångssätt för egenskapslikhet utvärderas för att visa modellers anpassningsförmåga till osäkerhet och prioritering av generalisering

Abstract [en]

Accurate prediction of house rental prices is a pivotal concern in the real estate domain, facilitating informed decision-making for both tenants and landlords. This study presents a comprehensive exploration of various machine learning techniques applied to a diverse dataset of housing features, with the overarching goal of uncovering the most effective algorithm for predicting rental prices. Through rigorous experimentation and meticulous analysis, we aim to provide insights into the strengths, limitations, and practical implementation prospects of different models within the dynamic context of house rental predictions. To train efficient models relevant features are extracted from the database and various feature engineering methods are performed that can be crucial in enhancing the quality of the model. The data used in the study was based on the signed house contracts and unsigned house applications received on the online housing platform Qasa. The study analyses the predictive capability of XGBoost and CatBoost models. Subsequent hyperparameter tuning yielded significant improvements, with lower RMSE scores. External feature that could possibly influence the price of the rent like walk score, Polar coordinates and interest rates are incorporated into the dataset from third-party API’s. The study reveals that adding these features introduces complexity, leading to both marginal increases in baseline models’ RMSE values and substantial enhancements post hyperparameter tuning. Our investigation also encompasses the construction and analysis of prediction intervals that predict possible range of rent, highlighting the importance of capturing true uncertainty accurately. The the performance of three different methods for calculating prediction intervals are analysed and the jack knife plus method consistently achieves the highest coverage scores, indicating its ability to accurately capture true observation ranges. The thesis investigates how combination of a dataset with certain rent values and a dataset with uncertain rent values can be incorporated in building a price prediction model. Various approaches such as source information feature approach , certainty feature approach, aggregated property features, and KNN-based property similarity approach are evaluated to demonstrate the models’ adaptability to uncertainty and the prioritization of generalization.

Place, publisher, year, edition, pages
2023. , p. 76
Series
TRITA-EECS-EX ; 2023:717
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-338119OAI: oai:DiVA.org:kth-338119DiVA, id: diva2:1805004
External cooperation
Qasa
Supervisors
Examiners
Available from: 2023-11-09 Created: 2023-10-15 Last updated: 2023-11-09Bibliographically approved

Open Access in DiVA

fulltext(1273 kB)860 downloads
File information
File name FULLTEXT02.pdfFile size 1273 kBChecksum SHA-512
4c2146de3213e6aea360f60366a5503fb3a3573ea524d798bc4cbdbf2c6b4de3e741f801e58d3bb80457cf7a9c6ba44830331c7876d24b2c86f93d26b92e63d4
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 860 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 719 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf