Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Evaluation of Musical Feature Extraction Tools using Perceptual Ratings.
KTH, School of Computer Science and Communication (CSC).
2011 (English)Independent thesis Advanced level (professional degree), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

The increasing availability of digital music has created a demand for organizing and retrieving the music. Thus, a new multi-disciplinary research area called music information retrieval, MIR, has emerged. An important part of the content-based field of the research area is to extract musical features, such as tempo or modality, directly from the content, i.e. the audio.

This thesis is an evaluation of available musical feature extraction tools. The evaluation is done by using the extracted musical features as predictors for perceptual ratings in correlation and regression analyses. The 11 perceptual ratings were gathered from a listening test. 22 musical audio features were extracted from the same stimuli, using different systems for musical feature extraction. These were chosen to predict some of the perceptual ratings based on findings in literature.

High inter-subject reliability in the listening test implied a high agreement among the subjects, indicating that 20 subjects were enough. Fairly low inter-correlations between the ratings indicated that they were rated independently from each other. Six out of seven perceptual ratings with a priori selected predictors correlated moderately with their corresponding predictor (r>0.6). The results from the stepwise regression analyses were also moderate, where the amount of variance explained by the predictors ranged from 29-76%, indicating that there is room for improvements for developing new feature extraction algorithms.

Abstract [sv]

Den ökande tillgängligheten av digital musik har skapat ett behov av att organisera och hitta musiken. På grund av detta har ett nytt tvärvetenskapligt forskningsområde vuxit fram, kallat music information retrieval eller MIR. En viktig del av den innehållsbaserade grenen av detta forskningsområde är att extrahera musikaliska egenskaper, såsom tempo eller modalitet, direkt från innehållet, dvs. ljudklippet.

Den här uppsatsen är en utvärdering av tillgängliga verktyg för att extrahera musikaliska egenskaper. Utvärderingen är en jämförelse som görs genom att använda dessa extraherade musikaliska egenskaper som prediktorer för perceptuella bedömningar, med hjälp av korrelations- och regressionsanalyser. De elva perceptuella bedömningarna samlades in från ett lyssningsförsök. 22 musikaliska egenskaper extraherades från samma stimuli med hjälp av olika system för att extrahera egenskaper från musik. Dessa musikaliska egenskaper valdes ut för att predicera några av de perceptuella bedömningarna, baserat på litteratur.

Hög validitet mellan försökspersonerna i lyssningsförsöket tyder på enighet mellan bedömningarna, vilket antyder att 20 försökspersoner räckte. Ganska låga korrelationer tyder på att bedömningarna av olika egenskaper var oberoende av varandra. Sex av sju perceptuella bedömningar med på förhand utvalda prediktorer korrelerade måttligt med motsvarande prediktor (r>0.6). Resultatet från den stegvisa regressionsanalysen var också måttlig, där 29-76% av variansen kunde förklaras av prediktorerna, vilket visar att det finns rum för förbättringar av algoritmer för att extrahera musikaliska egenskaper.

Place, publisher, year, edition, pages
2011.
Series
Trita-CSC-E, ISSN 1653-5715 ; 2011:028
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-130708OAI: oai:DiVA.org:kth-130708DiVA: diva2:654155
Educational program
Master of Science in Engineering - Media Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.nada.kth.se/utbildning/grukth/exjobb/rapportlistor/2011/rapporter11/hedblad_anton_11028.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 72 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf