Open this publication in new window or tab >>2025 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
Floods are becoming increasingly frequent and impactful worldwide, with their severity intensifying due to climate change. This growing threat has made all countries more vulnerable to natural disasters. Over the past few decades, Mozambique has been particularly affected by several tropical cyclones (TCs). In 2019, following the devastation caused by TCs Idai and Kenneth, Mozambique became the first country in southern Africa to be struck by two cyclones in the same rainy season. In 2023, it was hit twice by the same cyclone, TC Freddy, which was also recorded as the longest-lasting cyclone on record.
Given the extent of the damage caused by such events, there is an urgent need for efficient and cost-effective methods to map both flooded and flood-prone areas. These methods are essential for aiding local authorities in disaster preparedness, planning, and impact mitigation. Moreover, they play a vital role in providing information that supports evidence-based decisionmaking for sustainable development. Several remote sensing (RS) approaches have been proposed for post-flood assessment, including those based on machine learning (ML) and deep learning (DL). While effective, these approaches often require large amounts of annotated data and are typically task-specific,limiting their scalability and adaptability especially in data-scarce regions.
In this study, we investigate the use of multi-temporal Sentinel-1 (S1) Synthetic Aperture Radar (SAR) and Sentinel-2 (S2) Multi-Spectral Instrument(MSI) data, along with other data sources, to develop scalable, cost-effective,and computationally efficient methods for near real-time flood mapping and flood damage assessment (DA) in Mozambique. Additionally, we explore the use of Geo-Foundation Models (GFMs) on small datasets for flood mapping and DA, including ML-based alternatives to DL approaches.
As such, three approaches for flood mapping are proposed. The first is a fully automated method for near real-time flood mapping, utilizing multitemporal S1 data acquired over Beira municipality and the Macomia district. It identifies flooded areas by computing the difference between images acquired before and after the flooding event, followed by Otsu’s thresholding method for automatic flood area extraction. The second approach employs both supervised and unsupervised ML methods, such as Support Vector Machines (SVM) and K-Means clustering, leveraging a dataset provided by DrivenData, which was launched as part of a competition for flood mapping using SAR data. This dataset, based on S1, includes VH and VV imagery and labeled data from 13 countries worldwide. By harnessing the processing capability of the Google Earth Engine (GEE) platform, both approaches are presented as an alternative to traditional DL methods due to cost-effectiveness and low computational power requirements. The third approach involves finetuning a GFM, named Clay, on the DrivenData dataset for the task of flood mapping. Foundation Models (FMs) refer to models that are pre-trained on broad datasets typically using large-scale self-supervision and can be adapted(e.g., fine-tuned) for a wide range of downstream tasks. Clay was initially pre-trained for segmentation, classification, and biomass information extraction using a variety of sensors such as S1, S2, and Landsat. These models are reshaping how traditional ML and DL approaches are trained, significantly reducing the amount of time and data required for training while maintaining high standards of result quality.
Furthermore, we explored the use of S2 MSI data to generate a land cover(LC) map of the study area and estimate the percentage of flooded areas within each LC class. The results demonstrate that the combination of S1 and S2 data is a reliable approach for near real-time flood mapping and damage assessment. Using the first approach, we automatically mapped flooded areas with an overall accuracy of about 87–88% and kappa of 0.73–0.75. The second approach also produced satisfactory results, revealing that VH polarization and the combination of VV+VH performed better than using VV polarization alone. Specifically, in Cambodia and Bolivia, VH polarization yielded Intersection over Union (IoU) values ranging from 0.819 to 0.856.
Predictions for Beira using VH imagery resulted in an IoU of 0.568, which represents a reasonable outcome. The third approach achieved an IoU exceeding 0.92 and an F1-score above 0.96, outperforming the winning DL solution from the DrivenData competition, which attained an IoU of 0.8072 when the dataset was initially released.
The LC classification was validated by randomly collecting over 600 points for each LC class, achieving an overall accuracy of 90–95% with a kappa value of 0.80–0.94. These results enabled us to identify areas prone to flooding and regions where floodwaters recede more quickly, providing valuable insights for improved planning. Additionally, we determined the percentage of flooded LC categories such as Agriculture, Mangrove, and Built-up areas, as their destruction has significant implications for food security and socio-economic development.
Furthermore, to obtain more detailed insights into the damage in Beira,we deployed Clay for the task of Building Damage Classification (BDC), finetuning it on the EDDA dataset. The EDDA dataset, released in 2023, consists of geo-referenced drone imagery captured in Beira after TC Idai. The finetuned model achieved a validation IoU of 0.829, which was then compared to the results from a U-Net implementation that yielded a validation IoU of 0.567.
Therefore, the contribution of this thesis lies in providing practical, dataefficient solutions that enhance local disaster management capabilities and community resilience. We have demonstrated that while ML methods are efficient and cost-effective for near real-time flood mapping, particularly when combined with Sentinel data, GFMs offer improved accuracy (even with a small dataset), albeit with slightly higher computational requirements.
Abstract [sv]
Översvämningar blir allt vanligare och deras påverkan värre världen över, och deras förmåga att göra skada ökar på grund av klimatförändringarna. Detta växande hot har gjort alla länder mer sårbara för naturkatastrofer. Under de senaste decennierna har Moçambique särskilt drabbats av flera tropiska cykloner (TC). År 2019, efter förödelsen orsakad av TCs Idai och Kenneth, blev Moçambique det första landet i södra Afrika som drabbades av två cykloner under samma regnperiod. År 2023 träffades det två gånger av samma cyklon, TC Freddy, som också registrerades som den längsta varaktiga cyklonen någonsin. Med tanke på omfattningen av de skador som sådana händelser orsakar finns det ett akut behov av effektiva och kostnadseffektiva metoder för att kartlägga både översvämmade och översvämningsdrabbade områden.
Dessa metoder är viktiga för att hjälpa lokala myndigheter med katastrofberedskap, planering och begränsning av påverkan. Dessutom spelar de en viktig roll för att tillhandahålla information som stöder evidensbaserat beslutsfattande för hållbar utveckling. Flera metoder för fjärranalys (RS) har föreslagits för bedömning efter översvämning, inklusive de som bygger på maskininlärning (ML) och djupinlärning (DL). Även om de är effektiva, kräver dessa tillvägagångssätt ofta stora mängder kommenterad data och är vanligtvis uppgiftsspecifika, vilket begränsar deras skalbarhet och anpassningsförmåga, särskilt i områden med brist på data. I den här studien undersöker vi användningen av multi-temporal Sentinel-1 (S1) Synthetic Aperture Radar (SAR) och Sentinel-2 (S2) Multi-Spectral Instrument (MSI) data, tillsammans med andra datakällor, för att utveckla skalbara, kostnadseffektiva och beräkningseffektiva metoder för översvämningsbedömning (FM) och översvämningsskada (FM) i nära realtid. Dessutom utforskar vi användningen av Geo-Foundation Models (GFM) på små datamängder för FM och DA, inklusive ML-baserade alternativ till DL-metoder. Som sådan föreslås tre tillvägagångssätt för FM. Den första är en helt automatiserad metod för nära realtid FM, som använder multi-temporal S1-data som förvärvats över Beira kommun och Macomia-distriktet. Den identifierar översvämmade områden genom att beräkna skillnaden mellan bilder som tagits före och efter översvämningshändelsen, följt av Otsu’s tröskelmetod för automatisk utvinning av översvämningsområden. Det andra tillvägagångssättet använder både övervakade och oövervakade ML-metoder, såsom Support Vector Machines (SVM) och KMeans-klustring, som utnyttjar ett dataset från DrivenData, som lanserades som en del av en tävling för FM som använder SAR-data. Denna datauppsättning, baserad på S1, inkluderar VH- och VV-bilder och annoterad data från 13 länder över hela världen. Genom att utnyttja bearbetningsförmågan hos Google Earth Engine-plattformen (GEE) presenteras båda metoderna som ett alternativ till traditionella DL-metoder på grund av kostnadseffektivitet och låga krav på beräkningskraft. Det tredje tillvägagångssättet innebär att finjustera en GFM, kallad Clay, med DrivenData-datasetet för FM-uppgiften.
Grundmodeller (FoMs) hänvisar till modeller som är förtränade på breda datauppsättningar som vanligtvis använder storskalig självövervakning och som kan anpassas (t.ex. finjusteras) för ett brett utbud av nedströmsuppgifter. Clay var från början avsedd för segmentering, klassificering och utvinning av biomassainformation med hjälp av en mängd olika sensorer som S1, S2 och Landsat. Dessa modeller omformar hur traditionella ML- och DL-metoder tränas, vilket avsevärt minskar mängden tid och data som krävs för träning samtidigt som höga standarder för resultatkvalitet bibehålls. Dessutom undersökte vi användningen av S2 MSI-data för att generera en landtäckningskarta(LC) över studieområdet och uppskatta andelen översvämmade områden inom varje LC-klass. Resultaten visar att kombinationen av S1- och S2-data är ett tillförlitligt tillvägagångssätt för översvämningskartläggning och skadebedömning i nästan realtid. Med den första metoden kartlade vi automatisktöversvämmade områden med en total noggrannhet på cirka 87–88% och kappa på 0,73–0,75. Det andra tillvägagångssättet gav också tillfredsställande resultat, vilket avslöjade att VH-polarisering och kombinationen av VV+VH fungerade bättre än att använda enbart VV-polarisering. I synnerhet i Kambodja och Bolivia, gav VH-polarisering Intersection over Union-värden (IoU) från 0,819 till 0,856. Förutsägelser för Beira med VH-bilder resulterade i ett IoU på 0,568, vilket representerar ett rimligt resultat. Det tredje tillvägagångssättet uppnådde ett IoU som översteg 0,92 och ett F1-poäng över 0,96, vilketöverträffade den vinnande DL-lösningen från DrivenData-tävlingen, som uppnådde ett IoU på 0,8072 när datasetet initialt släpptes. LC-klassificeringen validerades genom att slumpmässigt samla in över 600 poäng för varje LC-klass, vilket uppnådde en total noggrannhet på 90–95% med ett kappavärde på 0,80–0,94. Dessa resultat gjorde det möjligt för oss att identifiera områden som är utsatta för översvämning och regioner där översvämningsvattnet minskar snabbare, vilket ger värdefulla insikter för förbättrad planering. Dessutom bestämde vi andelen översvämmade LC-kategorier som jordbruk, mangrove och bebyggda områden, eftersom deras förstörelse har betydande konsekvenser för livsmedelssäkerhet och socioekonomisk utveckling. Dessutom, för att få mer detaljerade insikter om skadorna i Beira, distribuerade vi Clay för uppgiften Building Damage Classification (BDC), och finjusterade den på EDDAdatauppsättningen. EDDA-datauppsättningen, som släpptes 2023, består av georefererade drönarebilder som tagits i Beira efter den tropiska cyklonen Idai. Den finjusterade modellen uppnådde en validerings-IoU på 0,829, som sedan jämfördes med resultaten från en U-Net-implementering som gav en validerings-IoU på 0,567. Därför ligger bidraget från denna avhandling i att tillhandahålla praktiska, dataeffektiva lösningar som förbättrar lokal katastrofhanteringskapacitet och samhällets motståndskraft. Vi har visat att även om ML-metoder är effektiva och kostnadseffektiva för nära realtids-FM, särskilt i kombination med Sentinel-data, erbjuder GFM förbättrad noggrannhet(även med en liten datamängd), om än med något högre beräkningskrav.
Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology, 2025. p. 86
Series
TRITA-ABE-DLT ; 2511
Keywords
Geo-Foundation Models, Machine Learning, Sentinel 1 and 2, Flood Mapping, Classification, Damage Assessment
National Category
Earth and Related Environmental Sciences
Research subject
Geodesy and Geoinformatics, Geoinformatics
Identifiers
urn:nbn:se:kth:diva-363806 (URN)978-91-8106-329-5 (ISBN)
Public defence
2025-06-12, D3, Lindstedtsvägen 9, KTH Campus, Public video conference link https://kth-se.zoom.us/j/67206163625, Stockholm, 09:30 (English)
Opponent
Supervisors
Note
QC 20250523
2025-05-232025-05-212025-12-17Bibliographically approved