kth.sePublications KTH
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Forecasting Icing Induced Production Loss on Wind Turbines: a Machine Learning Approach
KTH, School of Industrial Engineering and Management (ITM), Energy Technology.
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Wind power has grown to become one of the largest sources of electricity in Sweden, and in 2024 more than 40 TWh of electricity were generated from wind power. A majority of the wind power installed in Sweden is located in the country’s northern parts, where the turbines during the winter months are exposed to harsh winter conditions. In the right conditions, this can lead to ice formation on the turbines, affecting the turbines ability to generate power. With the increasing share of intermittent sources in the power system, accurate forecast becomes more important, and to accurately forecast generation from wind farms cold climates, icing has to be accounted for. This study evaluates the performance of three classification models, Random Forest Classifier, Light Gradient Boosting Model (LGBM), and XGBoost at predicting wind turbine icing as well as three regression models, Random Forest Regressor, Feedforward Neural Network (FNN), and Long Short-Term Memory (LSTM) at predicting the associated power loss on a wind farm in Sweden. The classification problem focuses on forecasting the binary status of an icing alarm, while the regression task estimates the magnitude of icing-induced power loss, with lead times of 6-36 hours. To account for turbine-specific behavior, models are trained separately for each turbine, using Supervisory Control and Data Acquisition (SCADA)- and Numerical Weather Predictions (NWP)-data from a period of three and a half years. The three classification models all predict icing and non-icing events with relatively high accuracy, even at lead times up to 36 hours. The Random Forest (RF)-classifier outperformed the XGBoost and LGBM, with the best and most consistently high scores. At a 36-hour lead time, the RF-classifier classified icing events with a Precision-Recall Area Under Curve (PR AUC) score of 0.626 for the turbine with highest performance. The boolean forecast result of the random forest classifier is used as an input feature to each regression model. For the regression problem, model performance varied greatly between turbines and lead times. No regression model consistently outperformed the others at every lead time. The FNN model outperformed the other models for most turbines at 6 and 12 hours lead time. None of the applied Machine Learning (ML)-models are consistently outperforming the simple persistence model used for benchmarking, indicating that the added complexity of the ML model is not fully justified. At 36 hours lead time, the best performing model was LSTM at turbine 1, achieving a R2 score of 0.497. Feature importance analysis revealed that the predicted icing status from the RF-classifier was the most important input variable in the regression models at both short and long lead times. These results highlight the value of including classification results as features into regression frameworks.

Abstract [sv]

Vindkraft har vuxit till att bli ett av de största energislagen i Sverige, och under 2024 genererades över 40 TWh el från vindkraften. Majoriteten av vindkraftverken befinner sig i norra Sverige, där turbinerna under vintermånaderna utsätts för låga temperaturer och tuffa väderförhållanden. Under sådana förhållanden kan is bildas på turbinerna, vilket påverkar turbinernas elproduktion. I takt med att andelen intermittent elproduktion i kraftsystemet ökar blir noggranna prognoser allt viktigare, och för att noggrant prognostisera elproduktion från vindparker i kalla klimat måste isbildning beaktas. Denna studie utvärderar tre klassificeringsmodeller, RF-classifier, LGBM och XGBoost, för att prediktera isbildning på vindkraftverk, samt tre regressionsmodeller, RF-regressor, FNN och LSTM, för att prognostisera effektförlusten som uppstår till följd av isbildningen. Klassificeringsmodellerna syftar till att förutsäga det binära tillståndet för ett isvarningssystem, medan regressionsuppgiften används för att uppskatta effektförlusten som isbildningen leder till, med ledtider från 6 till 36 timmar. För att ta hänsyn till turbinspecifikt beteende tränas modellerna separat för respektive turbin, med SCADA- och NWP-data som indata. Alla tre klassificeringsmodeller prognostiserade händelser då is antingen uppstod eller inte uppstod med relativt hög noggrannhet, även vid ledtider upp till 36 timmar. RF-modellen presterade bättre än både XGBoost och LGBM, med de bästa och mest konsekvent höga resultaten. Med en ledtid på 36 timmar uppnådde RFklassificeraren ett PR AUC-värde på 0,626 för turbinen med bäst prestanda. Det binära klassificeringsresultatet från RF-modellen användes därefter som indata till regressionsmodellerna, som indikation på framtidig isbildning. För regressionsmodellerna varierade modellernas prestanda relativt mycket mellan olika turbiner och ledtider. Ingen regressionsmodell presterade konsekvent bättreän de andra vid samtliga ledtider. För de flesta turbiner överträffade FNNmodellen de andra modellerna vid 6 och 12 timmars ledtid. Ingen av de tillämpade regressionsmodellerna överträffade konsekvent den enkla persistensmodellen som användes som referens, vilket tyder på att regressionsmodellernas komplexitet inte kan motiveras. Vid 36 timmars ledtid var LSTM den bäst presterande modellen för turbin 1, med ett R2-värde på 0,497. Analys av indata-variablerna visade att resultatet från RF-klassificeraren var den viktigaste indata-parametern i regressionsmodellerna vid både korta och långa ledtider. Dessa resultat belyser värdet av att inkludera klassificeringsresultat som indata i regressionsmodeller.

Place, publisher, year, edition, pages
2025. , p. 59
Series
TRITA-ITM-EX ; 2025:389
Keywords [en]
Machine Learning, Wind Power, Icing, Power Loss, Decision Trees, Neural Networks, LSTM
Keywords [sv]
Maskininlärning, Vindkraft, Icing, Produktionsbortfall, Beslutsträd, Neurala Nätverk, LSTM
National Category
Energy Engineering
Identifiers
URN: urn:nbn:se:kth:diva-369388OAI: oai:DiVA.org:kth-369388DiVA, id: diva2:1994740
External cooperation
Flower Infrastructure Technologies AB
Subject / course
Energy Technology
Educational program
Degree of Master
Presentation
2025-06-09, 00:00
Supervisors
Examiners
Available from: 2025-09-03 Created: 2025-09-03 Last updated: 2025-09-03Bibliographically approved

Open Access in DiVA

fulltext(3604 kB)102 downloads
File information
File name FULLTEXT01.pdfFile size 3604 kBChecksum SHA-512
9b3b123e157c440dfe94847abbe2f3d98138e265e4116eafb64644e6d78e9a7e3bb20bb4970ce64080cc88611eb5f455d13b279ed87b1eedbd143902460c64db
Type fulltextMimetype application/pdf

By organisation
Energy Technology
Energy Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 102 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 578 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf