kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
A dual-control dialogue framework for human-robot interaction data collection: integrating human emotional and contextual awareness with conversational AI
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0002-1001-6415
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0003-1399-6604
KTH, Skolan för elektroteknik och datavetenskap (EECS), Intelligenta system, Tal, musik och hörsel, TMH.ORCID-id: 0000-0002-0397-6442
2024 (Engelska)Ingår i: International Conference of Social Robotics (ICSR 2024), 2024Konferensbidrag, Poster (med eller utan abstract) (Refereegranskat)
Abstract [en]

This paper presents a dialogue framework designed to capture human-robot interactions enriched with human-level situational awareness. The system integrates advanced large language models with realtime human-in-the-loop control. Central to this framework is an interaction manager that oversees information flow, turn-taking, and prosody control of a social robot’s responses. A key innovation is the control interface, enabling a human operator to perform tasks such as emotion recognition and action detection through a live video feed. The operator also manages high-level tasks, like topic shifts or behaviour instructions.

Input from the operator is incorporated into the dialogue context managed by GPT-4o, thereby influencing the ongoing interaction. This allows for the collection of interactional data from an automated system that leverages human-level emotional and situational awareness. The audiovisual data will be used to explore the impact of situational awareness on user behaviors in task-oriented human-robot interaction.

Ort, förlag, år, upplaga, sidor
2024.
Nationell ämneskategori
Språkbehandling och datorlingvistik
Forskningsämne
Tal- och musikkommunikation
Identifikatorer
URN: urn:nbn:se:kth:diva-375300OAI: oai:DiVA.org:kth-375300DiVA, id: diva2:2027039
Konferens
International Conference of Social Robotics (ICSR 2024), Odense, Denmark, 24-26 October, 2024
Anmärkning

QC 20260112

Tillgänglig från: 2026-01-12 Skapad: 2026-01-12 Senast uppdaterad: 2026-01-12Bibliografiskt granskad

Open Access i DiVA

fulltext(1782 kB)33 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1782 kBChecksumma SHA-512
1cd2e6ba5e0fd30ae0ddd90deef0b4dbd3a7de9236081aa8964e45b2a600cabf2b14d937208dff9fb7fcdf013d4d7467149855f2a20b541b6990756e27e69405
Typ fulltextMimetyp application/pdf

Person

Marcinek, LubosBeskow, JonasGustafsson, Joakim

Sök vidare i DiVA

Av författaren/redaktören
Marcinek, LubosBeskow, JonasGustafsson, Joakim
Av organisationen
Tal, musik och hörsel, TMH
Språkbehandling och datorlingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 6155 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf