Eftergymnasiala programmeringskurser med stora klasser skapar utmaningar med att identifiera lågpresterande elever. Utbildningsdatautvinning är en möjlighet att åtgärda detta genom att objektivt bedöma elevers akademiska prestation. Vi genomförde en fallstudie på en 264 elever stor eftergymnasial programmeringskurs. Syftet var att skapa en klassificeringsmodell som kunde klassificera elever ifall de förväntades att inte vara färdiga med sin labbuppgift innan eller efter deadline. Datamängden innehöll hur många fel varje elev hade gjort på varje uppgift och om eleven var godkänd på laborationerna innan eller efter deadline. Genom att använda kronologiskt ordnade delmängder av labuppgifter framkom det att man kan klassificera elever tidigt i en labbkurs även genom att endast använda en fjärdedel av mängden deluppgifter med en uppnådd 80% precision och pricksäkerhet.
Large classrooms in the setting of programming higher education present issues in effectively identifying and supporting struggling students in time. The use of Educational Data Mining (EDM) methods presents an opportunity to alleviate these issues by objectively examining students’ learning activities. We carried out a case-study in the setting of a selected programming course featuring 264 students. The aim was to develop a classification model which could classify students into finishing their lab assignment before or after the set deadline. The dataset used contained a number of errors each student had made on each task, and whether the student passed their labs in time. Using chronologically ordered subsets of the lab tasks, it was found that the model could classify students already one fourth of the way into a lab course to around 80% precision and accuracy.