kth.sePublications
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Learning optimal CNN architectures for Precipitation Downscaling with Differentiable Architecture Search
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.). KTH, School of Electrical Engineering and Computer Science (EECS), Computer Science, Computational Science and Technology (CST).
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Att lära sig optimala CNN-arkitekturer för nedskalning av nederbörd med differentierbar arkitektursökning (Swedish)
Abstract [en]

Climate change poses a significant threat to both ecosystems and human societies, in part due to an expected increase in \gls{epe}. Accurately predicting where such events will occur more frequently is essential to minimize societal and economic impacts. While \gls{gcm} offer reliable long‑term forecasts at coarse temporal scales, their spatial resolution is too low to resolve localized extremes. \gls{cnn} with upsampling layers can be used to perform statistical downscaling from \gls{gcm} output to finer spatial resolutions, yet their architectures are typically designed manually. One such manually constructed \gls{cnn} was developed by the \gls{smhi} as part of the AI4PEX\footnote{\url{https://ai4pex.org/}} project.

This thesis introduces a modular and automated framework based on \gls{darts} to discover high‑performing \gls{cnn}s for statistical downscaling of precipitation. The search space was deliberately kept close to that of the proven baseline model to ensure fair comparability, while still exploring a range of cell and node combinations. Results show that every sufficiently complex configuration outperforms the baseline in validation loss, Matthews correlation coefficient, and diagnostic odds ratio. The best architectures also generalize well to a future climate scenario (SSP370), demonstrating robustness beyond the training distribution.

This work highlights that automated, modular architecture design can reliably produce competitive CNNs, reducing reliance on manual engineering and lowering the barrier for applying deep learning in climate services.

Abstract [sv]

Klimatförändringar utgör ett betydande hot mot både ekosystem och mänskliga samhällen, delvis på grund av en förväntad ökning av extrema nederbördstillfällen (\gls{epe}). Att kunna förutsäga var sådana händelser oftare kommer att inträffa är avgörande för att minska samhälleliga och ekonomiska konsekvenser. Även om \gls{gcm} ger tillförlitliga långsiktiga prognoser på grova tidsliga skalor, är deras rumsliga upplösning för låg för att kunna fånga lokala extremvärden. \gls{cnn} med uppskalningslager kan användas för att genomföra statistisk nedskalning från \gls{gcm}-utdata till finare rumsliga upplösningar, men deras arkitekturer är oftast manuellt utformade. En sådan manuellt konstruerad \gls{cnn} utvecklades av \gls{smhi} inom ramen för AI4PEX‑projektet\footnotemark[\value{footnote}].

Denna avhandling introducerar ett modulärt och helt automatiserat ramverk baserat på differentiell arkitektursökning (\gls{darts}) för att hitta högpresterande \gls{cnn}-modeller för statistisk nedskalning av nederbörd. Sökutrymmet hölls medvetet nära den beprövade baslinjemodellen för att möjliggöra rättvis jämförelse, samtidigt som olika kombinationer av celler och noder utforskades. Resultaten visar att varje tillräckligt komplex konfiguration – utan någon handgjord design och med minimal klimatspecifik kunskap – överträffar baslinjen vad gäller valideringsförlust, Matthews korrelationskoefficient och diagnostiskt odds‑förhållande. De bästa arkitekturerna generaliserar dessutom väl till ett framtida klimatscenario (SSP370), vilket visar på robusthet utanför träningsfördelningen.

Detta arbete visar att automatiserad, modulär arkitekturdesign på ett tillförlitligt sätt kan ta fram konkurrenskraftiga \gls{cnn}-modeller, minska beroendet av manuell ingenjörskonst och sänka tröskeln för att tillämpa djupinlärning inom klimattjänster.

Place, publisher, year, edition, pages
2025. , p. 442
Series
TRITA-SCI-GRU ; 2025:442
Keywords [en]
Downscaling, Neural Networks, Optimization, DARTS
National Category
Mathematical sciences
Identifiers
URN: urn:nbn:se:kth:diva-371997OAI: oai:DiVA.org:kth-371997DiVA, id: diva2:2008280
External cooperation
SMHI
Subject / course
Scientific Computing
Educational program
Master of Science - Computer Simulation for Science and Engineering
Supervisors
Examiners
Available from: 2025-10-29 Created: 2025-10-22 Last updated: 2025-10-29Bibliographically approved

Open Access in DiVA

fulltext(3646 kB)9 downloads
File information
File name FULLTEXT01.pdfFile size 3646 kBChecksum SHA-512
3db43176bd55d3bfcb371fcd907c9111fc2ae9538cf9950774a86583361e7fb35f4ce07b767a3a8c4ffbe03942192766403283707d4a1274a7e958ae53024e6a
Type fulltextMimetype application/pdf

By organisation
Mathematics (Dept.)Computational Science and Technology (CST)
Mathematical sciences

Search outside of DiVA

GoogleGoogle Scholar
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 101 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf