Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Music Information Retrieval – Automatic genre classification from acoustic features.
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2012 (English)Independent thesis Advanced level (professional degree), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

The aim of the study was to find a combination of machine learning algorithms and musical parameters which could automatically classify a large amount of music tracks into correct genres with high accuracy.

To mimic a real musical situation we used the Million Song Dataset as it contains pre-analysed data on a wide variety of tracks. On the basis of previous studies and our evaluations of the available musical parameters a selection of four algorithms and four combinations of parameters were made. All these combinations of parameters were evaluated with each of the algorithms.

The best algorithm used with the two best combinations resulted in 49% and 51% accuracy respectively. Compared to some of the previous studies in this field our results are not outstanding, but we believe our results are more relevant in a real musical situation due to our choice of dataset, parameters and genres. When we evaluated the parameters we discovered that the they differentiated very little between the genres.

Even though our results show that our implementation is not good enough to use in a real application, it does not exclude the possibility of implementing an application for automatic classification of tracks into correct genres with high accuracy. The fact that the parameters do not differentiate much indicate that it might be a very extensive task to achieve the goal of high accuracy.

Abstract [sv]

Syftet med den här studien var att hitta en kombination av maskininlärningsalgoritmer och musikaliska parametrar som automatiskt kan klassificera en stor mängd låtar med rätt genre med hög noggrannhet.

För att efterlikna en verklig musikalisk situation använde vi the Million Song Dataset eftersom den innehåller resultaten från musikaliska analyser av en stor mängd samtida låtar. På basis av tidigare studier och våra utvärderingar av de tillgängliga musikaliska parametrarna gjorde vi ett urval av fyra algoritmer och fyra kombinationer av parametrar. Samtliga kombinationer av parametrar utvärderades med var och en av algoritmerna.

Den bästa algoritmen resulterade i 49% respektive 51% noggrannhet när den användes tillsammans med de två bästa kombinationerna av parametrar. Jämfört med resultat från några av de tidigare studierna inom samma område är våra resultat inte enastående, men vi anser att våra resultat är mer relevanta i en verklig musikalisk situation på grund av vårt val av datamängd, parametrar och genrer. När vi utvärderade parametrarna upptäckte vi att de differentierade väldigt lite mellan genrerna.

Även om våra resultat visar att vår tillämpning inte är tillräckligt bra för att använda i ett riktigt program utesluter det inte möjligheten att skapa en applikation för automatisk genreklassificering av spår med hög noggrannhet. Det faktum att parametrarna inte skiljer sig åt mellan genrer indikerar dock att det kan vara en mycket omfattande uppgift att uppnå målet om hög noggrannhet.

Place, publisher, year, edition, pages
2012.
Series
Kandidatexjobb CSC, K12058
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-131063OAI: oai:DiVA.org:kth-131063DiVA: diva2:654509
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.csc.kth.se/utbildning/kandidatexjobb/datateknik/2012/rapport/ronnow_daniel_OCH_twetman_teodor_K12058.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 36 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf