kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Crowdsource-based validation of the audio cocktail as a sound browsing tool
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0003-1262-4876
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0001-9327-9482
2023 (Engelska)Ingår i: Interspeech 2023, International Speech Communication Association , 2023, s. 2178-2182Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

We conduct two crowdsourcing experiments designed to examine the usefulness of audio cocktails to quickly find out information on the contents of large audio data. Several thousand crowd workers were engaged to listen to audio cocktails with systematically varied composition. They were then asked to state either which sound out of four categories (Children, Women, Men, Orchestra) they heard the most of, or if they heard anything of a specific category at all. The results show that their responses have high reliability and provide information as to whether a specific task can be performed using audio cocktails. We also propose that the combination of crowd workers and audio cocktails can be used directly as a tool to investigate the contents of large audio data.

Ort, förlag, år, upplaga, sidor
International Speech Communication Association , 2023. s. 2178-2182
Nyckelord [en]
annotation, exploration, found speech, hearing, human-in-the-loop
Nationell ämneskategori
Språkbehandling och datorlingvistik Övrig annan humaniora
Identifikatorer
URN: urn:nbn:se:kth:diva-337834DOI: 10.21437/Interspeech.2023-2473ISI: 001186650302072Scopus ID: 2-s2.0-85171584146OAI: oai:DiVA.org:kth-337834DiVA, id: diva2:1803463
Konferens
24th International Speech Communication Association, Interspeech 2023, August 20-24, 2023, Dublin, Ireland
Anmärkning

QC 20241014

Tillgänglig från: 2023-10-09 Skapad: 2023-10-09 Senast uppdaterad: 2025-02-01Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Fallgren, PerEdlund, Jens

Sök vidare i DiVA

Av författaren/redaktören
Fallgren, PerEdlund, Jens
Av organisationen
Tal, musik och hörsel, TMH
Språkbehandling och datorlingvistikÖvrig annan humaniora

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 85 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf