kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Recommender Systems Using Limited Dataset Sizes
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2023 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Rekommendationssystem med begränsad datamängdsstorlek (Swedish)
Abstract [en]

In order to create personalized recommendations for users on services such as e-commerce websites and streaming platforms, recommender systems often utilize various machine learning techniques. A common technique used in recommender systems is collaborative filtering which creates rating predictions based on similar users’ interests. In this report we have compared two different approaches of implementing collaborative filtering by measuring their performance on movie rating datasets of varying sizes. The algorithms were singular value decomposition and imputation boosted collaborative filtering which were also compared to a baseline measurement of using the average rating as a prediction. The results show that utilizing singular value decomposition for a model-based approach is faster than using a memory-based approach with imputed data, but the memory-based approach gives more accurate predictions given a dataset size of more than around 25 users. This implies that the imputation boosted approach is mostly suitable for smaller dataset sizes of users, which might be found in less accessed services or services with infrequent recommendations. Singular value decomposition can instead be used for much larger dataset sizes albeit with a lower prediction accuracy, indicating that it can be used for services that handle more users and more frequent recommendations.

Abstract [sv]

Rekommendationssystem använder ofta maskininlärningsmetoder för att ge personliga rekommendationer till användare på bland annat e-handelswebbplatser och streamingtjänster. En vanlig metod som används i rekommendationssystem är kollaborativ filtrering, som förutspår hur en användare kommer betygsätta något baserat på liknande användares intressen. I denna rapport har vi jämfört två olika tillvägagångssätt för att implementera kollaborativ filtrering genom att mäta deras prestanda på datamängder av filmbetyg med varierande storlek. Algoritmerna som användes var singular value decomposition och imputation boosted collaborative filtering som även jämfördes med genomsnittsbetyg som förutsägelser. Resultaten visar att singular value decomposition som en modellbaserad metod är snabbare än att använda en minnesbaserad metod med genererad data, men den minnesbaserade metoden ger mer noggranna betyg för datamängder med mer än omkring 25 användare. Detta innebär att den minnesbaserade metoden med genererad data främst lämpar sig för datamängder med färre användare, vilket skulle kunna gynna tjänster som är mindre populära eller tjänster som sällan behöver ge nya rekommendationer. Singular value decomposition kan istället användas för betydligt större datamängder även om noggrannheten är något lägre, vilket lämpar tjänster med fler användare och frekventa rekommendationer.

Place, publisher, year, edition, pages
2023. , p. 34
Series
TRITA-EECS-EX ; 2023:313
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-330860OAI: oai:DiVA.org:kth-330860DiVA, id: diva2:1779222
Supervisors
Examiners
Available from: 2023-08-01 Created: 2023-07-03 Last updated: 2023-08-01Bibliographically approved

Open Access in DiVA

fulltext(841 kB)1215 downloads
File information
File name FULLTEXT01.pdfFile size 841 kBChecksum SHA-512
54d1fb045c439641a8816745afbd85e2c58bc7686ece806f76fdada07d1f990d87005ff2f2ba6706ae9f11192fd2cfd710a50773966f055e11a38f8849d9022e
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 1215 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 286 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf