Customer Churn Analysis within the context of a private bank
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Analys av kundbortfall inom ramen för en privatbank (Swedish)
Abstract [en]
After more than 10 years of abundant liquidity and easing monetary policy to limit the economic damage from the pandemic (Covid 19), central bank interest-rate start increasing to contain inflation and dry up the market from the cash excess. In this context of higher market volatility with high interest rates, the liquidity risk management is key to ensure financial stability and profitability along with lowering massive liquidity chocs among the financial institutions. This paper aims to investigate the customer churn analysis in order to know how many accounts are likely to close, and the consequences on the financial health of the bank. Data only from June 2023 are gathered, which makes it impossible to take a long-term view. The dataset is highly imbalanced: very few customers tend to churn. Therefore, resampling methods (SMOTE-NC and random undersampling) are used in order to diminish the effect of imbalance while keeping a dataset that catches different customer behaviours. Logistic Regression, Random Forest and Support Vector Machine are models used in order to predict and explain churn. We notice that, as expected, logistic regression performs well less than the two other models. Random Forest is the model that better explains churn whereas Support Vector Machine proves to be the most predictive model. These models can be improved with the incorporation of more dynamic variables (such as customer relationship) and of the economic environment.
Abstract [sv]
Efter mer än 10 år av god likviditet och expansiv penningpolitik för att motverka pandemins (Covid 19) ekonomiska skada så har centralbankernas styrräntor nu höjts för att stävja inflation bromsa det penningöverflöd som funnits på marknaden. Med högre marknadsvolatilitet och högre räntor är riskanalys av likviditet tillsammans med minskning av det penningöverflöd som funnits hos finansiella institutioner nyckelfaktorer för att säkerställa finansiell stabilitet och lönsamhet. Denna uppsats ämnar undersöka kundförluster - hur många kunder som sannolikt går förlorade och vilken finansiell påverkan det har på banken. Datan är endast insamlad från juni 2023 vilket omöjliggör en undersökning med långsiktig tidshorisont. Dataurvalet är väldigt obalanserat: få kunder synes förloras. Därför används resampling-metoder (SMOTE-NC och slumpmässig undersampling) för att minska effekten av obalans men samtidigt bevara ett dataurval som fångar olika kundbeteenden. Logistic Regression, Random Forest och Support Vector Machine är modellerna som används för att förutspå och förklara kundförluster. Vi noterar enligt förväntan att Logistic Regression presterar sämre än de övriga modellerna. Random Forest är den modell som bäst förklarar kundförluster medan Support Vector Machine påvisar sig vara den mest förutsägbara modellen. Dessa modeller kan stärkas genom att inkorporera mer dynamiska variabler (exempelvis kundrelation) och det ekonomiska klimatet.
Place, publisher, year, edition, pages
2024.
Series
TRITA-SCI-GRU ; 2024:447
Keywords [en]
Churn, current account, liquidity, margin, random resampling, SMOTE, predictability, logistic regression, random forest, support vector machine
Keywords [sv]
Churn, löpande räkning, likviditet, marginal, slumpmässigt nytt urval, SMOTE, förutsägbarhet, logistisk regression, random forest, support vektor maskin
National Category
Other Mathematics
Identifiers
URN: urn:nbn:se:kth:diva-361518OAI: oai:DiVA.org:kth-361518DiVA, id: diva2:1946301
External cooperation
Milleis Banque Privée
Subject / course
Financial Mathematics
Educational program
Master of Science in Engineering -Engineering Physics
Supervisors
Examiners
2025-03-202025-03-202025-03-20Bibliographically approved