kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Crowdsource-based validation of the audio cocktail as a sound browsing tool
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0003-1262-4876
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0001-9327-9482
2023 (Engelska)Ingår i: Interspeech 2023, International Speech Communication Association , 2023, s. 2178-2182Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

We conduct two crowdsourcing experiments designed to examine the usefulness of audio cocktails to quickly find out information on the contents of large audio data. Several thousand crowd workers were engaged to listen to audio cocktails with systematically varied composition. They were then asked to state either which sound out of four categories (Children, Women, Men, Orchestra) they heard the most of, or if they heard anything of a specific category at all. The results show that their responses have high reliability and provide information as to whether a specific task can be performed using audio cocktails. We also propose that the combination of crowd workers and audio cocktails can be used directly as a tool to investigate the contents of large audio data.

Ort, förlag, år, upplaga, sidor
International Speech Communication Association , 2023. s. 2178-2182
Nyckelord [en]
annotation, exploration, found speech, hearing, human-in-the-loop
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling) Övrig annan humaniora
Identifikatorer
URN: urn:nbn:se:kth:diva-337834DOI: 10.21437/Interspeech.2023-2473Scopus ID: 2-s2.0-85171584146OAI: oai:DiVA.org:kth-337834DiVA, id: diva2:1803463
Konferens
24th International Speech Communication Association, Interspeech 2023, Dublin, Ireland, Aug 20 2023 - Aug 24 2023
Anmärkning

QC 20231009

Tillgänglig från: 2023-10-09 Skapad: 2023-10-09 Senast uppdaterad: 2023-10-09Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Fallgren, PerEdlund, Jens

Sök vidare i DiVA

Av författaren/redaktören
Fallgren, PerEdlund, Jens
Av organisationen
Tal, musik och hörsel, TMH
Språkteknologi (språkvetenskaplig databehandling)Övrig annan humaniora

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 44 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf