Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Recommender Systems Using Limited Dataset Sizes
KTH, Skolan för elektroteknik och datavetenskap (EECS).
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2023 (engelsk)Independent thesis Basic level (degree of Bachelor), 10 poäng / 15 hpOppgaveAlternativ tittel
Rekommendationssystem med begränsad datamängdsstorlek (svensk)
Abstract [en]

In order to create personalized recommendations for users on services such as e-commerce websites and streaming platforms, recommender systems often utilize various machine learning techniques. A common technique used in recommender systems is collaborative filtering which creates rating predictions based on similar users’ interests. In this report we have compared two different approaches of implementing collaborative filtering by measuring their performance on movie rating datasets of varying sizes. The algorithms were singular value decomposition and imputation boosted collaborative filtering which were also compared to a baseline measurement of using the average rating as a prediction. The results show that utilizing singular value decomposition for a model-based approach is faster than using a memory-based approach with imputed data, but the memory-based approach gives more accurate predictions given a dataset size of more than around 25 users. This implies that the imputation boosted approach is mostly suitable for smaller dataset sizes of users, which might be found in less accessed services or services with infrequent recommendations. Singular value decomposition can instead be used for much larger dataset sizes albeit with a lower prediction accuracy, indicating that it can be used for services that handle more users and more frequent recommendations.

Abstract [sv]

Rekommendationssystem använder ofta maskininlärningsmetoder för att ge personliga rekommendationer till användare på bland annat e-handelswebbplatser och streamingtjänster. En vanlig metod som används i rekommendationssystem är kollaborativ filtrering, som förutspår hur en användare kommer betygsätta något baserat på liknande användares intressen. I denna rapport har vi jämfört två olika tillvägagångssätt för att implementera kollaborativ filtrering genom att mäta deras prestanda på datamängder av filmbetyg med varierande storlek. Algoritmerna som användes var singular value decomposition och imputation boosted collaborative filtering som även jämfördes med genomsnittsbetyg som förutsägelser. Resultaten visar att singular value decomposition som en modellbaserad metod är snabbare än att använda en minnesbaserad metod med genererad data, men den minnesbaserade metoden ger mer noggranna betyg för datamängder med mer än omkring 25 användare. Detta innebär att den minnesbaserade metoden med genererad data främst lämpar sig för datamängder med färre användare, vilket skulle kunna gynna tjänster som är mindre populära eller tjänster som sällan behöver ge nya rekommendationer. Singular value decomposition kan istället användas för betydligt större datamängder även om noggrannheten är något lägre, vilket lämpar tjänster med fler användare och frekventa rekommendationer.

sted, utgiver, år, opplag, sider
2023. , s. 34
Serie
TRITA-EECS-EX ; 2023:313
HSV kategori
Identifikatorer
URN: urn:nbn:se:kth:diva-330860OAI: oai:DiVA.org:kth-330860DiVA, id: diva2:1779222
Veileder
Examiner
Tilgjengelig fra: 2023-08-01 Laget: 2023-07-03 Sist oppdatert: 2023-08-01bibliografisk kontrollert

Open Access i DiVA

fulltext(841 kB)1215 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 841 kBChecksum SHA-512
54d1fb045c439641a8816745afbd85e2c58bc7686ece806f76fdada07d1f990d87005ff2f2ba6706ae9f11192fd2cfd710a50773966f055e11a38f8849d9022e
Type fulltextMimetype application/pdf

Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 1215 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 286 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf