Learning optimal CNN architectures for Precipitation Downscaling with Differentiable Architecture Search
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Att lära sig optimala CNN-arkitekturer för nedskalning av nederbörd med differentierbar arkitektursökning (Swedish)
Abstract [en]
Climate change poses a significant threat to both ecosystems and human societies, in part due to an expected increase in \gls{epe}. Accurately predicting where such events will occur more frequently is essential to minimize societal and economic impacts. While \gls{gcm} offer reliable long‑term forecasts at coarse temporal scales, their spatial resolution is too low to resolve localized extremes. \gls{cnn} with upsampling layers can be used to perform statistical downscaling from \gls{gcm} output to finer spatial resolutions, yet their architectures are typically designed manually. One such manually constructed \gls{cnn} was developed by the \gls{smhi} as part of the AI4PEX\footnote{\url{https://ai4pex.org/}} project.
This thesis introduces a modular and automated framework based on \gls{darts} to discover high‑performing \gls{cnn}s for statistical downscaling of precipitation. The search space was deliberately kept close to that of the proven baseline model to ensure fair comparability, while still exploring a range of cell and node combinations. Results show that every sufficiently complex configuration outperforms the baseline in validation loss, Matthews correlation coefficient, and diagnostic odds ratio. The best architectures also generalize well to a future climate scenario (SSP370), demonstrating robustness beyond the training distribution.
This work highlights that automated, modular architecture design can reliably produce competitive CNNs, reducing reliance on manual engineering and lowering the barrier for applying deep learning in climate services.
Abstract [sv]
Klimatförändringar utgör ett betydande hot mot både ekosystem och mänskliga samhällen, delvis på grund av en förväntad ökning av extrema nederbördstillfällen (\gls{epe}). Att kunna förutsäga var sådana händelser oftare kommer att inträffa är avgörande för att minska samhälleliga och ekonomiska konsekvenser. Även om \gls{gcm} ger tillförlitliga långsiktiga prognoser på grova tidsliga skalor, är deras rumsliga upplösning för låg för att kunna fånga lokala extremvärden. \gls{cnn} med uppskalningslager kan användas för att genomföra statistisk nedskalning från \gls{gcm}-utdata till finare rumsliga upplösningar, men deras arkitekturer är oftast manuellt utformade. En sådan manuellt konstruerad \gls{cnn} utvecklades av \gls{smhi} inom ramen för AI4PEX‑projektet\footnotemark[\value{footnote}].
Denna avhandling introducerar ett modulärt och helt automatiserat ramverk baserat på differentiell arkitektursökning (\gls{darts}) för att hitta högpresterande \gls{cnn}-modeller för statistisk nedskalning av nederbörd. Sökutrymmet hölls medvetet nära den beprövade baslinjemodellen för att möjliggöra rättvis jämförelse, samtidigt som olika kombinationer av celler och noder utforskades. Resultaten visar att varje tillräckligt komplex konfiguration – utan någon handgjord design och med minimal klimatspecifik kunskap – överträffar baslinjen vad gäller valideringsförlust, Matthews korrelationskoefficient och diagnostiskt odds‑förhållande. De bästa arkitekturerna generaliserar dessutom väl till ett framtida klimatscenario (SSP370), vilket visar på robusthet utanför träningsfördelningen.
Detta arbete visar att automatiserad, modulär arkitekturdesign på ett tillförlitligt sätt kan ta fram konkurrenskraftiga \gls{cnn}-modeller, minska beroendet av manuell ingenjörskonst och sänka tröskeln för att tillämpa djupinlärning inom klimattjänster.
Place, publisher, year, edition, pages
2025. , p. 442
Series
TRITA-SCI-GRU ; 2025:442
Keywords [en]
Downscaling, Neural Networks, Optimization, DARTS
National Category
Mathematical sciences
Identifiers
URN: urn:nbn:se:kth:diva-371997OAI: oai:DiVA.org:kth-371997DiVA, id: diva2:2008280
External cooperation
SMHI
Subject / course
Scientific Computing
Educational program
Master of Science - Computer Simulation for Science and Engineering
Supervisors
Examiners
2025-10-292025-10-222025-10-29Bibliographically approved