kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
"Well", what can you do with messy data? Exploring the prosody and pragmatic function of the discourse marker "well" with found data and speech synthesis
University of Edinburgh, UK.
University of Edinburgh, UK.
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0003-1175-840X
2024 (Engelska)Ingår i: Interspeech 2024, International Speech Communication Association , 2024, s. 4084-4088Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Recently, there has been growing interest in the synthesis of conversational speech prosody. Conversational prosody is variable and carries many pragmatic functions. As speech synthesis research moves to using large amounts of untranscribed data, it is crucial that we understand the subtle pragmatic differences prosody can make. This study focuses on discourse markers, which are linguistic elements that perform various communicative functions, with their specific roles often linked to their prosodic realisation. In this paper, we explore the prosodic realisation of well using an unlabelled corpus of conversational speech. We use clustering to explore the variation in its prosodic realisation and identify common patterns in a data-driven manner. We synthesise the cluster centroids using controllable speech synthesis. Finally, we evaluate how the prosodic realisation of well affects the meaning of an utterance.

Ort, förlag, år, upplaga, sidor
International Speech Communication Association , 2024. s. 4084-4088
Nyckelord [en]
conversational speech synthesis, pragmatics, prosody
Nationell ämneskategori
Jämförande språkvetenskap och allmän lingvistik Språkbehandling och datorlingvistik Datavetenskap (datalogi) Studier av enskilda språk
Identifikatorer
URN: urn:nbn:se:kth:diva-358879DOI: 10.21437/Interspeech.2024-2122ISI: 001331850104038Scopus ID: 2-s2.0-85214836302OAI: oai:DiVA.org:kth-358879DiVA, id: diva2:1930532
Konferens
25th Interspeech Conferece 2024, Kos Island, Greece, Sep 1 2024 - Sep 5 2024
Anmärkning

QC 20250127

Tillgänglig från: 2025-01-23 Skapad: 2025-01-23 Senast uppdaterad: 2025-12-05Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Székely, Éva

Sök vidare i DiVA

Av författaren/redaktören
Székely, Éva
Av organisationen
Tal, musik och hörsel, TMH
Jämförande språkvetenskap och allmän lingvistikSpråkbehandling och datorlingvistikDatavetenskap (datalogi)Studier av enskilda språk

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 68 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf