Leveraging Meteorological Predictions for Data-Driven Forecasting of Photovoltaic Power
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Att utnyttja meteorologiska prognoser för datadriven förutsägelse av solcellskraft (Swedish)
Abstract [en]
Accurate forecasting of PV power generation is crucial for energy providers to effectively participate in day-ahead (D-1) and two-day-ahead (D-2) markets, including FCR-D, day-ahead, and intraday. Enhanced forecasting allows PV power generation to contribute to grid stability and supports the broader transition to renewable energy. This degree project presents two innovative forecasting strategies aimed at predicting photovoltaic (PV) power generation for the next day (D-1) and the day after (D-2) at a solar park with a rated capacity of 10 MW, located in Sweden. The first step involved evaluating numerical weather predictions (NWPs) obtained from Rebase, a forecasting platform that consolidates NWPs from various weather models. Rebase standardizes and quantifies these models to ensure consistency across the data. Using the most accurate weather models available, two datasets were generated, providing hourly weather forecasts for both D-1 and D-2. Simultaneously, NWP data from another forecasting platform, Meteomatics, was analyzed. Meteomatics provided proprietary weather forecasts for D-1 and D-2, resulting in two additional datasets. Building on this weather data, two machine learning models were developed to forecast PV power on an hourly basis for each forecast horizon. These models were trained using the opensource library CatBoost, utilizing both the NWP data and features derived from the historical PV power time series. To further enhance accuracy, a binary classification model—also built with CatBoost—was implemented to select the most accurate prediction at each time step. This method created an ensemble of two forecasting models and one binary classifier for each forecast horizon (D-1 and D-2). The ensemble model proved to be more robust and demonstrated superior performance compared to the individual forecasting models. For D-1, the ensemble model achieved a Root Mean Square Error (RMSE) of 1235.04 kW, while for D-2, the RMSE was 1358.15 kW. This integrated approach improves PV power forecasting accuracy by leveraging the strengths of multiple weather models and advanced machine learning techniques. Additionally, it ensures continued PV power predictions even if one of the weather data sources (Rebase or Meteomatics) fails. This reliability facilitates the solar park’s participation in the electricity market with accurate D-1 and D-2 forecasts.
Abstract [sv]
Noggrann prognos av PV-effektproduktion är avgörande för energileverantörer att effektivt delta i dag-före (D-1) och två-dagar-före (D-2) marknader, inklusive FCR-D, dag-före och intradag. Förbättrad prognos gör det möjligt för PV-effektproduktion att bidra till nätstabilitet och stödja den bredare övergången till förnybar energi. Detta examensarbete presenterar två innovativa prognosstrategier som syftar till att förutspå fotovoltaisk (PV) effektproduktion för nästa dag (D-1) och dagen därpå (D-2) vid en solpark med en installerad kapacitet på 10 MW, belägen i Sverige. Det första steget innefattade att utvärdera numeriska väderprognoser (NWP) som erhållits från Rebase, en prognosplattform som konsoliderar NWP från olika vädermodeller. Rebase standardiserar och kvantifierar dessa modeller för att säkerställa konsekvens över data. Med hjälp av de mest exakta vädermodellerna som finns tillgängliga, skapades två dataset som gav timvisa väderprognoser för både D-1 och D-2. Samtidigt analyserades NWP-data från en annan prognosplattform, Meteomatics. Meteomatics tillhandahöll egenväderprognoser för D-1 och D-2, vilket resulterade i två ytterligare dataset. Byggt på dessa väderdata utvecklades två maskininlärningsmodeller för att prognostisera PV-effekt på timbasis för varje prognoshorisont. Dessa modeller tränades med den öppen källkodsbiblioteket CatBoost, som utnyttjade både NWP-data och funktioner härledda från den historiska PV-effekt-tidsserien. För att ytterligare förbättra noggrannheten implementerades en binär klassificeringsmodell—också byggd med CatBoost—för att välja den mest exakta prognosen vid varje tidpunkt. Denna metod skapade en ensemble av två prognosmodeller och en binär klassificerare för varje prognoshorisont (D-1 och D-2). Ensemblemodellen visade sig vara mer robust och uppvisade överlägsen prestanda jämfört med de individuella prognosmodellerna. För D-1 uppnådde ensemblemodellen ett Root Mean Square Error (RMSE) på 1235,04 kW, medan RMSE för D-2 var 1358,15 kW. Denna integrerade metod förbättrar noggrannheten i PV-effektprognoser genom att utnyttja styrkorna hos flera vädermodeller och avancerade maskininlärningstekniker. Dessutom säkerställer den fortsatt PV-effektprognoser även om en av väderdatasystemen (Rebase eller Meteomatics) skulle misslyckas. Denna tillförlitlighet underlättar solparkens deltagande i elmarknaden med precisa D-1 och D-2 prognoser.
Place, publisher, year, edition, pages
2024. , p. 54
Series
TRITA-ITM-EX ; 2024:412
Keywords [en]
PV power forecasting, Numerical Weather Prediction, gradient-boosted tree-based models, binary classification, short-term forecasting
Keywords [sv]
Prognostisering av solcellskraft, Numeriska väderprognoser, Gradientsvept trädmodeller, Binär klassificering, Korttidsprognostisering
National Category
Energy Engineering
Identifiers
URN: urn:nbn:se:kth:diva-354237OAI: oai:DiVA.org:kth-354237DiVA, id: diva2:1902663
Subject / course
Energy and Climate Studies
Educational program
Degree of Master
Presentation
2024-09-02, 00:00
Supervisors
Examiners
2024-10-022024-10-022024-10-02Bibliographically approved