Change search
ReferencesLink to record
Permanent link

Direct link
Rekommendationssystem med begränsad data: Påverkan av gles data och cold start på rekommendationsalgoritmen Slope One
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2016 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Limited Data in Recommender Systems : The Impact of ​Sparse Data​ and C​old Start on the Recommendation Algorithm Slope One (English)
Abstract [sv]

I dagens överflöd av information och produkter på nätet, har rekommendationssystem blivit viktiga för att kunna presentera sådant som är intressant och relevant för varje enskild användare. Rekommendationssystem kan både förutsäga produktbetyg och ta fram ett urval av rekommenderade produkter för en användare.

Ett vanligt problem för rekommendationssystem är begränsad data, vilket kan försämra korrektheten i systemets rekommendationer och förutsägelser avsevärt. De vanligaste typerna av begränsad data är gles data och cold start. Gles data innebär att det finns en liten mängd produktbetyg i förhållande till antalet användare och produkter i systemet. Cold start är i stället då en ny användare eller produkt ska läggas till i systemet, och därmed saknar betyg.

Denna rapport har som syfte att studera hur korrektheten i rekommendationsalgoritmen Slope Ones förutsägelser påverkas av begränsad data. De situationer som undersöks är gles data samt cold start-­situationerna ny användare och ny produkt. Rapporten undersöker även om situationen ny användare kan avhjälpas genom att låta nya användare betygsätta ett litet antal produkter direkt när de läggs till i systemet.

Sammanfattningsvis, visar rapportens resultat att Slope One är olika känslig för de olika typerna av begränsad data. I enlighet med tidigare forskning, kan slutsatsen dras att Slope One är okänslig för gles data. Vad gäller cold start, blir korrektheten avsevärt sämre, och dessa situationer kan således sägas vara problematiska för Slope One.

Abstract [en]

In today’s abundance of online information and products, recommender systems have become essential in finding what is interesting and relevant for each user. Recommender systems both predict product ratings and produce a selection of recommended products for a user.

Limited data is a common issue for recommender systems and can greatly impair their ability to produce accurate predictions and recommendations. The most prevailing types of limited data are sparse data and cold start. The data in a dataset is said to be sparse if the number of ratings is small compared to the number of users and products. Cold start, on the other hand, is when a new user or product is added to the system and therefore completely lacks ratings.

The objective of this report is to study the impact of limited data on the accuracy of predictions produced by the recommendation algorithm Slope One. More specifically, this report examines the impact of sparse data and the two cold start situations new user and new product. The report also investigates whether asking new users to rate a small number of products, instantly after being added to the system, is a successful strategy in order to cope with the problem of making accurate predictions for new users.

In summary, it can be deduced from the results of this report that the sensitivity of Slope One varies between the types of limited data. In accordance with previous studies, Slope One appears insensitive to sparse data. On the other hand, for cold start, the accuracy is seriously affected and cold start can thus be said to be problematic for Slope One.

Place, publisher, year, edition, pages
National Category
Computer Science
URN: urn:nbn:se:kth:diva-186734OAI: diva2:927885
Available from: 2016-05-18 Created: 2016-05-13 Last updated: 2016-05-18Bibliographically approved

Open Access in DiVA

fulltext(1128 kB)12 downloads
File information
File name FULLTEXT01.pdfFile size 1128 kBChecksum SHA-512
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 12 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 23 hits
ReferencesLink to record
Permanent link

Direct link