kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Recommender Systems Using Limited Dataset Sizes
KTH, Skolan för elektroteknik och datavetenskap (EECS).
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2023 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)Alternativ titel
Rekommendationssystem med begränsad datamängdsstorlek (Svenska)
Abstract [en]

In order to create personalized recommendations for users on services such as e-commerce websites and streaming platforms, recommender systems often utilize various machine learning techniques. A common technique used in recommender systems is collaborative filtering which creates rating predictions based on similar users’ interests. In this report we have compared two different approaches of implementing collaborative filtering by measuring their performance on movie rating datasets of varying sizes. The algorithms were singular value decomposition and imputation boosted collaborative filtering which were also compared to a baseline measurement of using the average rating as a prediction. The results show that utilizing singular value decomposition for a model-based approach is faster than using a memory-based approach with imputed data, but the memory-based approach gives more accurate predictions given a dataset size of more than around 25 users. This implies that the imputation boosted approach is mostly suitable for smaller dataset sizes of users, which might be found in less accessed services or services with infrequent recommendations. Singular value decomposition can instead be used for much larger dataset sizes albeit with a lower prediction accuracy, indicating that it can be used for services that handle more users and more frequent recommendations.

Abstract [sv]

Rekommendationssystem använder ofta maskininlärningsmetoder för att ge personliga rekommendationer till användare på bland annat e-handelswebbplatser och streamingtjänster. En vanlig metod som används i rekommendationssystem är kollaborativ filtrering, som förutspår hur en användare kommer betygsätta något baserat på liknande användares intressen. I denna rapport har vi jämfört två olika tillvägagångssätt för att implementera kollaborativ filtrering genom att mäta deras prestanda på datamängder av filmbetyg med varierande storlek. Algoritmerna som användes var singular value decomposition och imputation boosted collaborative filtering som även jämfördes med genomsnittsbetyg som förutsägelser. Resultaten visar att singular value decomposition som en modellbaserad metod är snabbare än att använda en minnesbaserad metod med genererad data, men den minnesbaserade metoden ger mer noggranna betyg för datamängder med mer än omkring 25 användare. Detta innebär att den minnesbaserade metoden med genererad data främst lämpar sig för datamängder med färre användare, vilket skulle kunna gynna tjänster som är mindre populära eller tjänster som sällan behöver ge nya rekommendationer. Singular value decomposition kan istället användas för betydligt större datamängder även om noggrannheten är något lägre, vilket lämpar tjänster med fler användare och frekventa rekommendationer.

Ort, förlag, år, upplaga, sidor
2023. , s. 34
Serie
TRITA-EECS-EX ; 2023:313
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:kth:diva-330860OAI: oai:DiVA.org:kth-330860DiVA, id: diva2:1779222
Handledare
Examinatorer
Tillgänglig från: 2023-08-01 Skapad: 2023-07-03 Senast uppdaterad: 2023-08-01Bibliografiskt granskad

Open Access i DiVA

fulltext(841 kB)1215 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 841 kBChecksumma SHA-512
54d1fb045c439641a8816745afbd85e2c58bc7686ece806f76fdada07d1f990d87005ff2f2ba6706ae9f11192fd2cfd710a50773966f055e11a38f8849d9022e
Typ fulltextMimetyp application/pdf

Av organisationen
Skolan för elektroteknik och datavetenskap (EECS)
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 1215 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 286 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf