Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Are real tongue movements easier to speech read than synthesized?
KTH, Skolan för datavetenskap och kommunikation (CSC), Centra, Centrum för Talteknologi, CTT. KTH, Skolan för datavetenskap och kommunikation (CSC), Tal, musik och hörsel, TMH, Tal-kommunikation.ORCID-id: 0000-0003-4532-014X
KTH, Skolan för datavetenskap och kommunikation (CSC), Centra, Centrum för Talteknologi, CTT. KTH, Skolan för datavetenskap och kommunikation (CSC), Tal, musik och hörsel, TMH, Tal-kommunikation.
2009 (Engelska)Ingår i: INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, BAIXAS: ISCA-INST SPEECH COMMUNICATION ASSOC , 2009, s. 824-827Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Speech perception studies with augmented reality displays in talking heads have shown that tongue reading abilities are weak initially, but that subjects become able to extract some information from intra-oral visualizations after a short training session. In this study, we investigate how the nature of the tongue movements influences the results, by comparing synthetic rule-based and actual, measured movements. The subjects were significantly better at perceiving sentences accompanied by real movements, indicating that the current coarticulation model developed for facial movements is not optimal for the tongue.

Ort, förlag, år, upplaga, sidor
BAIXAS: ISCA-INST SPEECH COMMUNICATION ASSOC , 2009. s. 824-827
Nyckelord [en]
multimodal speech perception, augmented reality, visual speech synthesis
Nationell ämneskategori
Data- och informationsvetenskap Kommunikationsvetenskap Jämförande språkvetenskap och allmän lingvistik
Identifikatorer
URN: urn:nbn:se:kth:diva-29881ISI: 000276842800206Scopus ID: 2-s2.0-70450207970OAI: oai:DiVA.org:kth-29881DiVA, id: diva2:399049
Konferens
10th INTERSPEECH 2009 Conference, Brighton, ENGLAND, SEP 06-10, 2009
Anmärkning
QC 20110221Tillgänglig från: 2011-02-21 Skapad: 2011-02-17 Senast uppdaterad: 2018-01-12Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

ScopusISCA

Sök vidare i DiVA

Av författaren/redaktören
Engwall, OlovWik, Preben
Av organisationen
Centrum för Talteknologi, CTTTal-kommunikation
Data- och informationsvetenskapKommunikationsvetenskapJämförande språkvetenskap och allmän lingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 212 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf