Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Prediction of three articulatory categories in vocal sound imitations using models for auditory receptive fields
KTH, Skolan för elektroteknik och datavetenskap (EECS), Tal, musik och hörsel, TMH.ORCID-id: 0000-0003-2926-6518
KTH, Skolan för elektroteknik och datavetenskap (EECS), Beräkningsvetenskap och beräkningsteknik (CST).ORCID-id: 0000-0002-9081-2170
KTH, Skolan för elektroteknik och datavetenskap (EECS), Tal, musik och hörsel, TMH.
KTH, Skolan för elektroteknik och datavetenskap (EECS), Tal, musik och hörsel, TMH.ORCID-id: 0000-0002-3511-023X
Visa övriga samt affilieringar
2018 (Engelska)Ingår i: Journal of the Acoustical Society of America, ISSN 0001-4966, E-ISSN 1520-8524, Vol. 144, nr 3, s. 1467-1483Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Vocal sound imitations provide a new challenge for understanding the coupling between articulatory mechanisms and the resulting audio. In this study, we have modeled the classification of three articulatory categories, phonation, supraglottal myoelastic vibrations, and turbulence from audio recordings. Two data sets were assembled, consisting of different vocal imitations by four professional imitators and four non-professional speakers in two different experiments. The audio data were manually annotated by two experienced phoneticians using a detailed articulatory description scheme. A separate set of audio features was developed specifically for each category using both time-domain and spectral methods. For all time-frequency transformations, and for some secondary processing, the recently developed Auditory Receptive Fields Toolbox was used. Three different machine learning methods were applied for predicting the final articulatory categories. The result with the best generalization was found using an ensemble of multilayer perceptrons. The cross-validated classification accuracy was 96.8 % for phonation, 90.8 % for supraglottal myoelastic vibrations, and 89.0 % for turbulence using all the 84 developed features. A final feature reduction to 22 features yielded similar results.

Ort, förlag, år, upplaga, sidor
Acoustical Society of America (ASA), 2018. Vol. 144, nr 3, s. 1467-1483
Nyckelord [en]
vocal articulation, sound imitations, signal processing, auditory receptive fields, turbulence, phonation, supraglottal myoelastic vibration, partial least-square regression, support vector classification, ensemble learning
Nationell ämneskategori
Signalbehandling Data- och informationsvetenskap
Forskningsämne
Tal- och musikkommunikation
Identifikatorer
URN: urn:nbn:se:kth:diva-234295DOI: 10.1121/1.5052438ISI: 000457802200049Scopus ID: 2-s2.0-85053873907OAI: oai:DiVA.org:kth-234295DiVA, id: diva2:1245861
Forskningsfinansiär
EU, FP7, Sjunde ramprogrammet, 618067
Anmärkning

QC 20181003

Tillgänglig från: 2018-09-06 Skapad: 2018-09-06 Senast uppdaterad: 2019-02-22Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopushttps://doi.org/10.1121/1.5052438

Personposter BETA

Lindeberg, TonyTernström, Sten

Sök vidare i DiVA

Av författaren/redaktören
Friberg, AndersLindeberg, TonyHellwagner, MartinHelgason, PéturSalomão, Gláucia LaísElovsson, AndersLemaitre, GuillaumeTernström, Sten
Av organisationen
Tal, musik och hörsel, TMHBeräkningsvetenskap och beräkningsteknik (CST)
I samma tidskrift
Journal of the Acoustical Society of America
SignalbehandlingData- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 346 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf