Modeling Player Evaluation in Ice Hockey Using Machine Learning
2026 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Modellering av spelarutvärdering i ishockey med hjälp av maskininlärning (Swedish)
Abstract [en]
Evaluating player performance in ice hockey is a long-standing challenge because of the high complexity of the sport and limitations of existing metrics. Traditional statistics, such as goals and assists, provide a partial view of performance, while advanced statistics like Corsi or expected goals remain difficult to interpret and often fail to isolate individual contributions. External ratings, such as those in the EA Sports NHL series, offer standardized measures but lack transparency in how scores are obtained. The aim of this thesis is to investigate whether it is possible to develop an interpretable scoring system for ice hockey players based on season-level statistics, designed to predict standardized player ratings and identify which features contribute most to these predictions. Data from the 2024-2025 season was collected from Eliteprospects and Moneypuck, with ratings collected automatically from NHLratings.net. Additional features, including per-game and per-60 statistics, shooting percentages, and z-scores, were engineered. Machine learning models, including linear regression, Ridge regression, Lasso Regression, random forest, and gradient boosting were applied together with interpretability analysis using feature importance analysis. The results show that season-level statistics alone can approximate standardized player ratings with reasonable accuracy, with offensive production and ice time consistently emerging as the most influential features, while defensive contributions were less well captured by the available metrics.
Abstract [sv]
Att utvärdera spelares prestationer i ishockey är en långvarig utmaning på grund av sportens höga komplexitet och begränsningar i befintliga mått. Traditionell statistik, såsom mål och assist, ger endast en partiell bild av prestation, medan avancerad statistik som Corsi eller förväntade mål är svår att tolka och ofta misslyckas med att isolera individuella bidrag. Externa betyg, såsom de i EA Sports NHL-serien, erbjuder standardiserade mått men saknar transparens kring hur poängen beräknas. Syftet med denna avhandling är att undersöka om det är möjligt att utveckla ett tolkningsbart poängsystem för ishockeyspelare baserat på säsongsnivåstatistik, utformat för att predicera standardiserade spelarbetyg och identifiera vilka egenskaper som bidrar mest till dessa prediktioner. Data från säsongen 2024–2025 samlades in från Eliteprospects och Moneypuck, medan betyg samlades in automatiskt från NHLratings.net. Ytterligare egenskaper, inklusive statistik per match och per 60 minuter, skottprocent samt z-poäng, konstruerades. Maskininlärningsmodeller, däribland linjär regression, Ridge-regression, Lasso-regression, Random Forest och gradient boosting, tillämpades tillsammans med tolkningsanalys genom analys av variabelbetydelse. Resultaten visar att säsongsnivåstatistik i sig kan approximera standardiserade spelarbetyg med rimlig noggrannhet, där offensiv produktion och istid konsekvent framträder som de mest inflytelserika egenskaperna, medan defensiva bidrag fångas sämre av de tillgängliga måtten.
Place, publisher, year, edition, pages
2026. , p. 49
Series
TRITA-CBH-GRU ; 2026:012
Keywords [en]
Ice hockey analytics, Player performance evaluation, Machine learning, Interpretability, Scoring systems, Sports data mining
Keywords [sv]
Ishockeyanalys, utvärdering av spelarprestationer, maskininlärning, tolkningsbarhet, poängsystem, datautvinning inom sport
National Category
Sport and Fitness Sciences Computer Sciences
Identifiers
URN: urn:nbn:se:kth:diva-376715OAI: oai:DiVA.org:kth-376715DiVA, id: diva2:2038362
External cooperation
Everysport Group AB
Educational program
Master of Science - Sports Technology
Supervisors
Examiners
2026-02-132026-02-132026-02-13Bibliographically approved