kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
A sample of sampling strategies for audio similarity learning
KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap.
2022 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)Alternativ titel
Ett urval av urvalssmetoder för inlärning av ljudlikhet (Svenska)
Abstract [en]

Training of machine learning models often require sampling when the dataset is large. The manner in which one samples data points, for the mini-batches as well as for the loss function, has been shown to have an impact on the performance of the model as well as on its convergence during training. We set out to measure the impact of sampling strategies on an audio similarity model developed by Epidemic Sound. To this purpose, we evaluate using distance weighted sampling for the triplet loss and Poisson Disk Sampling for the mini-batch sampling. While we did not find that the alternative strategy for gathering mini-batches improved the model, the alternative triplet mining strategy showed promising results and opened up for further exploration into this area.

Abstract [sv]

Träning av maskininlärningsmodeller kräver ofta att urval sker när datamängden är stor. Hur detta urval sker, för antingen mini-batches eller kostnadsfunktionen, har visats ha en inverkan på modellens slutgiltiga prestation samt på konvergenstid. Vi har valt att utvärdera urvalsstrategins inverkan på en ljudlikhetsmodell utvecklad av Epidemic Sound. I detta syfte har vi valt att utvärdera distance weighted sampling för trillingkostnadsfunktionen och Poissondiskurval som urvalsprocess för mini-batches. Vi fann ej att en alternativ urvalsprocess för mini-batches gav bättre resultat men däremot att den alternativa trillingsurvalsprocessen gav lovande resultat som öppnar upp för vidare forskning.

Ort, förlag, år, upplaga, sidor
2022. , s. 25
Serie
TRITA-EECS-EX ; 2022:523
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:kth:diva-320171OAI: oai:DiVA.org:kth-320171DiVA, id: diva2:1703898
Ämne / kurs
Datalogi
Utbildningsprogram
Civilingenjörsexamen - Datateknik
Handledare
Examinatorer
Tillgänglig från: 2022-10-17 Skapad: 2022-10-15 Senast uppdaterad: 2022-11-09Bibliografiskt granskad

Open Access i DiVA

fulltext(1135 kB)196 nedladdningar
Filinformation
Filnamn FULLTEXT02.pdfFilstorlek 1135 kBChecksumma SHA-512
40cf1eb244b723e6960346ad838be218e0faf1fcbe198dc5a5aff5c26141b569bdc0df16db2bd09700de2de654410d447b53cd6a957baf0741b7720836434005
Typ fulltextMimetyp application/pdf

Av organisationen
Datavetenskap
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 205 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 361 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf