kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Joint Learning of Context and Feedback Embeddings in Spoken Dialogue
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0002-7885-5477
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0002-8579-1790
2024 (Engelska)Ingår i: Interspeech 2024, International Speech Communication Association , 2024, s. 2955-2959Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Short feedback responses, such as backchannels, play an important role in spoken dialogue. So far, most of the modeling of feedback responses has focused on their timing, often neglecting how their lexical and prosodic form influence their contextual appropriateness and conversational function. In this paper, we investigate the possibility of embedding short dialogue contexts and feedback responses in the same representation space using a contrastive learning objective. In our evaluation, we primarily focus on how such embeddings can be used as a context-feedback appropriateness metric and thus for feedback response ranking in U.S. English dialogues. Our results show that the model outperforms humans given the same ranking task and that the learned embeddings carry information about the conversational function of feedback responses.

Ort, förlag, år, upplaga, sidor
International Speech Communication Association , 2024. s. 2955-2959
Nyckelord [en]
backchannel, contrastive learning, conversational systems, dialogue, feedback, function, representation learning, unsupervised learning
Nationell ämneskategori
Språkbehandling och datorlingvistik Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-358871DOI: 10.21437/Interspeech.2024-1082ISI: 001331850103015Scopus ID: 2-s2.0-85214790716OAI: oai:DiVA.org:kth-358871DiVA, id: diva2:1930524
Konferens
25th Interspeech Conferece 2024, Kos Island, Greece, Sep 1 2024 - Sep 5 2024
Projekt
tmh_feedback
Anmärkning

QC 20250127

Tillgänglig från: 2025-01-23 Skapad: 2025-01-23 Senast uppdaterad: 2025-12-05Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Qian, LiviaSkantze, Gabriel

Sök vidare i DiVA

Av författaren/redaktören
Qian, LiviaSkantze, Gabriel
Av organisationen
Tal, musik och hörsel, TMH
Språkbehandling och datorlingvistikDatavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 145 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf