kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Application of data-driven models in exploring cyanobacterial bloom risks in Lake Mälaren
KTH, School of Architecture and the Built Environment (ABE), Sustainable development, Environmental science and Engineering.
2021 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Tillämpning av datadrivna modeller för att utforska cyanobakterieblomningsrisker i Mälaren (Swedish)
Abstract [en]

Cyanobacteria are a unique organism, a bacterium that develop photosynthesis, thus it contains chlorophyll, a pigment commonly associated to algae. For this reason, cyanobacteria are also known as blue-green algae. One of the secondary metabolites of cyanobacteria is cyanotoxin, a substance which is hepatoxic, neurotoxic, and dermatoxic. The frequency and intensity of cyanobacterial blooms have been of increasing concern in the last decades for drinking water supply. There is a need to improve monitoring of cyanobacteria content at source water for drinking water supply and its indicators and correlation with other chemical, physical and biological parameters. This study aims to identify the potential cyanobacterial bloom risk in Lake Mälaren by determining the influential chemical and physical parameters using Random Forest in classification mode. The classification was done using the WHO Alert Level Frameworks and study cases for lakes in Sweden. The data used to model was downloaded from the website of the Swedish University of Agricultural Science. It comprises 33 monitoring stations from 1964 to 2020, 21 chemical parameters, including cyanobacteria biovolume and chlorophyll content. Given the heterogeneity of data, the monitoring stations were grouped into Clusters. Using the data, statistical, correlation, time series, and principal component analysis were performed. Through these methods, spatial, distribution and temporal analysis were obtained. Afterwards, several models were determined using Random Forest. However, the mean values of cyanobacteria distributed over time indicated a medium risk, the maximum values suggested high risk in several areas of the Lake. Maximum concentrations were present at the west and northeast of the Lake, where the major inflows from the Watershed are discharged. As the water flows through the basin, the concentration of cyanobacteria reduces by half, which suggested that the large and deep bays act as sedimentation ponds. A very high correlation was found between the Cluster 5 and 6, east and middle northeast of the Lake, respectively. Finally, the contributing factors identified after modelling cyanobacteria as target factor were chlorophyll, month, water temperature, oxygen content, transparency, NO2NO3N, TN/TP, Ca, Mg and Cl. 

Abstract [sv]

Cyanobakterier är unika organismer, bakterier som utvecklar fotosyntes, så de innehåller klorofyll, ett pigment som vanligtvis förknippas med alger. Av denna anledning är cyanobakterier också kända som blågröna alger. En av de sekundära metaboliterna av cyanobakterier är cyanotoxin, ett ämne som är hepatoxiskt, neurotoxiskt och dermatoxiskt. Frekvensen och intensiteten av cyanobakterieblomningar har varit ett ökande problem under de senaste decennierna för dricksvattenförsörjningen. Många vattenreningsverk mäter inte innehållet av cyanobakterier i vatten; medan andra kemiska, fysikaliska och biologiska parametrar mäts. Denna studie syftar till att identifiera den potentiella risken för cyanobakteriell blomning i Mälaren genom att bestämma de mest inflytelserika kemiska och fysikaliska parametrarna med hjälp av metoden Random Forest i klassificeringsläge. Klassificeringen gjordes med hjälp av WHO Alert Level Frameworks och olika studier av sjöar i Sverige. Data som användes för att modellera laddades ner från Sveriges Lantbruksuniversitets webbplats. Den omfattar 33 övervakningsstationer från 1964 till 2020, med 21 kemiska parametrar, inklusive cyanobakteriers biovolym och klorofyllhalt. Med tanke på heterogeniteten i data grupperades övervakningsstationerna i kluster. Med hjälp av data utfördes statistisk analys, korrelation, tidsserier och huvudkomponentanalys. Genom dessa metoder erhölls rumslig, distribution och tidsanalys. Efteråt bestämdes flera modeller med hjälp av Random Forest. Medelvärdena för cyanobakterier fördelade över tiden indikerade en medelrisk, medan maximivärdena antydde något annat. Maximala koncentrationer fanns i väster och nordost om Mälaren, där de stora inflödena från vattendelaren släpps ut. När vattnet rinner genom bassängen minskar koncentrationen av cyanobakterier till hälften, vilket tyder på att de stora och djupa vikarna fungerar som sedimentationsdammar. En mycket hög korrelation hittades mellan kluster 5 och 6, öster respektive mellan nordost om sjön. Slutligen var de viktigaste faktorerna som identifierades efter modellering av cyanobakterier som målfaktor klorofyll, månad, vattentemperatur, syrehalt, transparens, NO2NO3N, TN/TP, Ca, Mg och Cl. 

Place, publisher, year, edition, pages
2021. , p. 49
Series
TRITA-ABE-MBT ; 21620
Keywords [en]
Random Forest, blue-green algae, WHO Alert Level Framework, drinking water supply, cyanobacterial blooms
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:kth:diva-306068OAI: oai:DiVA.org:kth-306068DiVA, id: diva2:1619818
Supervisors
Examiners
Available from: 2021-12-14 Created: 2021-12-14 Last updated: 2022-06-25Bibliographically approved

Open Access in DiVA

fulltext(2548 kB)146 downloads
File information
File name FULLTEXT01.pdfFile size 2548 kBChecksum SHA-512
be91650a9b16b50925bd11c771ad4916aa14864715f3941911243e146dc7cbd26eae58d5941c5fa215eb742952930670a508550ae814ba17a76107527a4f8fbc
Type fulltextMimetype application/pdf

By organisation
Sustainable development, Environmental science and Engineering
Engineering and Technology

Search outside of DiVA

GoogleGoogle Scholar
Total: 147 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 669 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf