In order to create personalized recommendations for users on services such as e-commerce websites and streaming platforms, recommender systems often utilize various machine learning techniques. A common technique used in recommender systems is collaborative filtering which creates rating predictions based on similar users’ interests. In this report we have compared two different approaches of implementing collaborative filtering by measuring their performance on movie rating datasets of varying sizes. The algorithms were singular value decomposition and imputation boosted collaborative filtering which were also compared to a baseline measurement of using the average rating as a prediction. The results show that utilizing singular value decomposition for a model-based approach is faster than using a memory-based approach with imputed data, but the memory-based approach gives more accurate predictions given a dataset size of more than around 25 users. This implies that the imputation boosted approach is mostly suitable for smaller dataset sizes of users, which might be found in less accessed services or services with infrequent recommendations. Singular value decomposition can instead be used for much larger dataset sizes albeit with a lower prediction accuracy, indicating that it can be used for services that handle more users and more frequent recommendations.
Rekommendationssystem använder ofta maskininlärningsmetoder för att ge personliga rekommendationer till användare på bland annat e-handelswebbplatser och streamingtjänster. En vanlig metod som används i rekommendationssystem är kollaborativ filtrering, som förutspår hur en användare kommer betygsätta något baserat på liknande användares intressen. I denna rapport har vi jämfört två olika tillvägagångssätt för att implementera kollaborativ filtrering genom att mäta deras prestanda på datamängder av filmbetyg med varierande storlek. Algoritmerna som användes var singular value decomposition och imputation boosted collaborative filtering som även jämfördes med genomsnittsbetyg som förutsägelser. Resultaten visar att singular value decomposition som en modellbaserad metod är snabbare än att använda en minnesbaserad metod med genererad data, men den minnesbaserade metoden ger mer noggranna betyg för datamängder med mer än omkring 25 användare. Detta innebär att den minnesbaserade metoden med genererad data främst lämpar sig för datamängder med färre användare, vilket skulle kunna gynna tjänster som är mindre populära eller tjänster som sällan behöver ge nya rekommendationer. Singular value decomposition kan istället användas för betydligt större datamängder även om noggrannheten är något lägre, vilket lämpar tjänster med fler användare och frekventa rekommendationer.