kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Effects of different characteristics of sound data on multi-label classification accuracy
KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap.
KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap.
2022 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)Alternativ titel
Egenskaper hos ljuddata och dess påverkan på multi-label-klassificering (Svenska)
Abstract [en]

One of many areas to which machine learning can be applied is sound recognition. A multi-label classification problem is a problem where several sounds, which are played simultaneously, are to be identified. This study investigates how frequency and volume affect the accuracy with which musical instruments are identified by a traditional machine learning method. Auto-generated sound files with up to 8 instruments playing at once, was used to explore which characteristics affect the classification accuracy. The results show that instruments with unique frequencies are often correctly identified. Further, they show that if two instruments share some frequencies, the one with higher volume will be accurately identified more often than the quieter instrument. When the louder instrument is removed from the test data, the accuracy of the quieter instrument increases significantly. The conclusion is that the instrument which has lower volume of two which share frequencies, is less likely to be identified by the classifier. Unique frequencies contribute to high accuracy. Thus, both volume and frequency play a role when identifying sound.

Abstract [sv]

Ett av många områden maskininlärning kan appliceras på är identifiering av ljud. I en fil med flera ljud, som hörs simlutant, kallas problemet att identifiera dessa ett multi-label klassificeringsproblem. I den här rapporten undersöks hur volym och frekvens hos musikinstrument påverkar deras möjlighet att identifieras av en traditionell maskininlärningsmetod. Autogenererade ljudfiler med upp till 8 musikinstrument som spelar samtidigt användes för att undersöka vilka aspekter som påverkar klassificeringen. Resultatet visar att instrument som är ensamma i sina frekvensområden identifieras med hög noggrannhet. Vidare visar resultatet att om två instrument delar frekvensområde kommer det instrument som har högst volym vara enklast att identifiera. Med ”enklast” menas att det instrumentet blir korrekt identifierat störst andel av gångerna. När det högre instrumentet exkluderas från testdatan ökar andelen gånger det lägre instrumentet identifieras korrekt markant. Slutsatsen är att det instrument som har lägre volym av två som delar frekvensområde har sämre möjlighet att identifieras korrekt av klassificeraren. Instrument med unika frekvenser har god möjlighet att identifieras korrekt. Därmed har både volym och frekvens påverkan på möjligheten att identifiera ljud.

Ort, förlag, år, upplaga, sidor
2022. , s. 38
Serie
TRITA-EECS-EX ; 2022:486
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:kth:diva-319908OAI: oai:DiVA.org:kth-319908DiVA, id: diva2:1702461
Ämne / kurs
Datalogi
Utbildningsprogram
Civilingenjörsexamen - Datateknik
Handledare
Examinatorer
Tillgänglig från: 2022-10-11 Skapad: 2022-10-11 Senast uppdaterad: 2022-10-11Bibliografiskt granskad

Open Access i DiVA

fulltext(915 kB)107 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 915 kBChecksumma SHA-512
f884a22842d7be2ae16638182c0975bb45b11efe4e43fff20c043efc3019db64de42c4f522075bb089b6b905a6a8370b7f8c18199c76b2d9fdea061b9731b23a
Typ fulltextMimetyp application/pdf

Av organisationen
Datavetenskap
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 107 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 223 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf