kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Probability of Default Prediction for a Market-Entry Credit Risk Model using Domain Adaptation Techniques
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.), Mathematics (Div.).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Prediktering av sannolikheten för betalningsinställelse med hjälp av domänadaptering för kreditriskmodeller i en ny marknad (Swedish)
Abstract [en]

This project deals with the problem of developing a market-entry credit risk model to predict the probability-of-default for borrowers in a new, unobserved, market. We propose a strategy to employ the framework of transfer learning, and in particular techniques within the sub-field known as domain adaptation, to train a classifier on labeled data from established markets and transferring this knowledge to make informed predictions in the unobserved market. The goal is to investigate whether such a method can reach performance similar to credit risk models which are tailored to a specific market (i.e., training and prediction is performed on data from the same market). The method is primarily based on a technique called adversarial validation which is a systematic way to estimate the the distributional divergence between two data sets. This is also the core component of a proposed feature selection method given the name adversarial sequential backward selection (ASBS) which can be applied instead of classical sequential backward selection when labeled data in the domain of interest is not available. By using catBoost as a base classifier, bootstrapping the training data and employing ASBS, we were able to rank features based on how similar they are in the two domains as well as their predictive ability. The results shows that feature selection based on this approach can help to improve the performance of the market-entry model to some extent but performance similar to the market-tailored models was not seen. We were also able to estimate the distance between any two datasets (i.e., markets) without requiring any labeled data.

Abstract [sv]

Detta projekt undersöker hur man kan utveckla en kreditriskmodell för prediktering av "probability of default" (PD) för låntagare i en ny, oobserverad, marknad. Vi presenterar en strategi där vi använder oss av ett "transfer learning"-ramverk och i synnerhet tekniker från delområdet "domain adaptation". Detta möjliggör träning av en klassificerare på märkt data från etablerade marknader som sedan använder denna kunskap för att göra informerade predikteringar i den oobserverade marknaden. Huvudmålet är att undersöka om en sådan modell kan uppnå jämförbar prestanda med kreditriskmodeller som är anpassade efter en och samma marknad, dvs träning och prediktering sker på data från samma fördelning. Metoden vi använder oss av är primärt baserad på en teknik som heter "adversarial validation" vilket är ett systematiskt sätt att estimera divergensen i fördelningen mellan två datamängder. Detta är också huvudkomponenten i vår föreslagna metod med namnet "adversarial sequential backward selection" (ASBS) som kan appliceras istället för klassisk "sequential backward selection" när märkt data inte är tillgänglig i den aktuella domänen. Genom att använda en klassificeringsmetod vid namn "catBoost", dragning med återläggning från träningsmängden och tillämpa ASBS, lyckas vi rangordna alla "features", trots avsaknaden av märkt data, baserat på hur varje feature påverkar skillnaden i fördelning mellan två marknader samt deras prediktiva förmåga. Resultaten indikerar att en "feature selection" baserat på denna metod kan förbättra prestandan av modellen till en viss grad, men vi uppnår inte samma prestanda som kreditriskmodeller som är anpassade för en och samma marknad. Vi lyckas även estimera avståndet mellan två godtyckliga marknader, utan tillgång till märkt data.

Place, publisher, year, edition, pages
2024. , p. 46
Series
TRITA-SCI-GRU ; 2024:455
Keywords [en]
credit risk, probability of default, transfer learning, domain adaptation, adversarial validation, catboost
Keywords [sv]
kreditrisk, betalningsinställelse, domänadaptering
National Category
Other Mathematics
Identifiers
URN: urn:nbn:se:kth:diva-362849OAI: oai:DiVA.org:kth-362849DiVA, id: diva2:1954958
External cooperation
Qred AB
Subject / course
Mathematical Statistics
Educational program
Master of Science - Applied and Computational Mathematics
Supervisors
Examiners
Available from: 2025-04-28 Created: 2025-04-28 Last updated: 2025-04-28Bibliographically approved

Open Access in DiVA

fulltext(2778 kB)25 downloads
File information
File name FULLTEXT01.pdfFile size 2778 kBChecksum SHA-512
2de23ca4d784df714fdb78d3fd2f447296ddea605671f7a55e4898ca96ca9ca3178ae3ecce2cebcc0894d942b359cc32c39ed1e567b1872fc8e3041923283b2c
Type fulltextMimetype application/pdf

By organisation
Mathematics (Div.)
Other Mathematics

Search outside of DiVA

GoogleGoogle Scholar
Total: 25 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 227 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf