kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Customer Churn Analysis within the context of a private bank
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.), Probability, Mathematical Physics and Statistics.
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Analys av kundbortfall inom ramen för en privatbank (Swedish)
Abstract [en]

After more than 10 years of abundant liquidity and easing monetary policy to limit the economic damage from the pandemic (Covid 19), central bank interest-rate start increasing to contain inflation and dry up the market from the cash excess. In this context of higher market volatility with high interest rates, the liquidity risk management is key to ensure financial stability and profitability along with lowering massive liquidity chocs among the financial institutions. This paper aims to investigate the customer churn analysis in order to know how many accounts are likely to close, and the consequences on the financial health of the bank. Data only from June 2023 are gathered, which makes it impossible to take a long-term view. The dataset is highly imbalanced: very few customers tend to churn. Therefore, resampling methods (SMOTE-NC and random undersampling) are used in order to diminish the effect of imbalance while keeping a dataset that catches different customer behaviours. Logistic Regression, Random Forest and Support Vector Machine are models used in order to predict and explain churn. We notice that, as expected, logistic regression performs well less than the two other models. Random Forest is the model that better explains churn whereas Support Vector Machine proves to be the most predictive model. These models can be improved with the incorporation of more dynamic variables (such as customer relationship) and of the economic environment.

Abstract [sv]

Efter mer än 10 år av god likviditet och expansiv penningpolitik för att motverka pandemins (Covid 19) ekonomiska skada så har centralbankernas styrräntor nu höjts för att stävja inflation bromsa det penningöverflöd som funnits på marknaden. Med högre marknadsvolatilitet och högre räntor är riskanalys av likviditet tillsammans med minskning av det penningöverflöd som funnits hos finansiella institutioner nyckelfaktorer för att säkerställa finansiell stabilitet och lönsamhet. Denna uppsats ämnar undersöka kundförluster - hur många kunder som sannolikt går förlorade och vilken finansiell påverkan det har på banken. Datan är endast insamlad från juni 2023 vilket omöjliggör en undersökning med långsiktig tidshorisont. Dataurvalet är väldigt obalanserat: få kunder synes förloras. Därför används resampling-metoder (SMOTE-NC och slumpmässig undersampling) för att minska effekten av obalans men samtidigt bevara ett dataurval som fångar olika kundbeteenden. Logistic Regression, Random Forest och Support Vector Machine är modellerna som används för att förutspå och förklara kundförluster. Vi noterar enligt förväntan att Logistic Regression presterar sämre än de övriga modellerna. Random Forest är den modell som bäst förklarar kundförluster medan Support Vector Machine påvisar sig vara den mest förutsägbara modellen. Dessa modeller kan stärkas genom att inkorporera mer dynamiska variabler (exempelvis kundrelation) och det ekonomiska klimatet.

Place, publisher, year, edition, pages
2024.
Series
TRITA-SCI-GRU ; 2024:447
Keywords [en]
Churn, current account, liquidity, margin, random resampling, SMOTE, predictability, logistic regression, random forest, support vector machine
Keywords [sv]
Churn, löpande räkning, likviditet, marginal, slumpmässigt nytt urval, SMOTE, förutsägbarhet, logistisk regression, random forest, support vektor maskin
National Category
Other Mathematics
Identifiers
URN: urn:nbn:se:kth:diva-361518OAI: oai:DiVA.org:kth-361518DiVA, id: diva2:1946301
External cooperation
Milleis Banque Privée
Subject / course
Financial Mathematics
Educational program
Master of Science in Engineering -Engineering Physics
Supervisors
Examiners
Available from: 2025-03-20 Created: 2025-03-20 Last updated: 2025-03-20Bibliographically approved

Open Access in DiVA

fulltext(938 kB)60 downloads
File information
File name FULLTEXT01.pdfFile size 938 kBChecksum SHA-512
5f8b958d37500093de6ecbf43ab5878b56d027ef0e93b64dfe5094b6a88a60eb03bbb8b3a01c8e0ecb17236dbd9a9acad4c0f83a461b5af6ab26e76bb6c5fd3d
Type fulltextMimetype application/pdf

By organisation
Probability, Mathematical Physics and Statistics
Other Mathematics

Search outside of DiVA

GoogleGoogle Scholar
Total: 60 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 418 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf