Gaze-Based Intent Recognition in Virtual Reality: A Case Study of Pandemic: Hot Zone - Europe
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Blick-baserad avsiktsigenkänning i virtuell verklighet : En fallstudie av Pandemic: Hot Zone – Europe (Swedish)
Abstract [en]
This thesis investigates gaze-based intent recognition within Pandemic: Hot Zone – Europe, a collaborative board game adapted into a Virtual Reality (VR) environment. Intent recognition, a critical area in human-computer interaction, uses observable behaviors such as gaze to infer human goals and actions. Building upon prior research in gaze-based intent modeling and heuristic planning, this study develops a model that combines gaze data with probabilistic and heuristic models to predict player actions in this complex and dynamic environment. A VR version of the game was developed to enable real-time data collection, including gaze fixations, which were used to infer player intents. The results demonstrate that the inclusion of gaze data notably improves the model performance, particularly after the players first action, where the large initial set of intents is drastically narrowed. For instance, broader metrics such as Hit@5 and Hit@10 showed marked improvements, with the gaze-based model reaching 55.8% and 65.1% accuracy before the second action respectively, compared to 34.9% and 51.2% without gaze data. However, the results also highlight limitations in early- turn predictions, where overlapping fixation mappings and the large number of intents reduced the model’s effectiveness. Evident in Hits@1, the strictest evaluation criteria, which produced a notably worse performance, 27.9% using gaze data compared to 18.6% without. Despite these challenges, the findings indicate that gaze behavior is a valuable input for reducing the number of intents and providing actionable predictions. Before the final action, the model utilizing gaze data demonstrated over 90% accuracy in broader metrics such as Hit@5 and Hit@10, and 69.8% for Hit@1, showcasing its ability to reliably capture the player’s plan. While predicting the exact sequence earlier in the turn is less consistent, the strong performance in broader metrics highlights the model’s potential to support decision-making by narrowing down plausible intents, even in a complex and dynamic game environment. Finally, while the small dataset limits the ability to achieve statistical significance, the observed trends provide valuable insights and highlight promising directions for future research and applications. This includes exploring larger datasets, dynamic fixation mapping strategies, and the many capabilities of the VR environment, such as capturing additional modalities like speech and hand gestures, to enhance the robustness and practical application of such models.
Abstract [sv]
Denna avhandling undersöker blickbaserad avsiktsigenkänning för Pandemic: Hot Zone – Europe, ett brädspel fokuserat på sammarbete mellan deltagarna som för denna studie anpassats till en virtuell verklighetsmiljö (VR). Avsikts- igenkänning, ett centralt forskningsområde inom människa-datorinteraktion, använder observerbara beteenden såsom en persons blick för att förutsäga avsikter. Genom att bygga vidare på tidigare forskning inom blickbaserad avsiktsmodellering och heuristik planering utvecklar denna studie en modell som kombinerar blickdata med probabilistiska och heuristiska modeller för att förutsäga spelarens avsikt. En VR-version av spelet utvecklades för att möjliggöra insamling av speldata, inklusive blickfixeringar, vilket användes för att härleda spelarnas avsikter. Resultaten visar att inkluderingen av blickdata noterbart förbättrar modellens prestanda, särskligt efter spelarens första handling, där den stora initiala mängden potentiella avsikter kraftigt reduceras. Till exempel uppvisade bredare mått såsom Hit@5 och Hit@10 markanta förbättringar, där den blickbaserade modellen nådde 55, 8% respek- tive 65, 1% träffsäkerhet innan spelaren gjorde sin andra handling, jämfört med 34, 9% och 51, 2% utan blickdata. Samtidigt visade resultaten också modellens begränsingar vid tidiga prediktioner i rundan, där överlappande fixeringsmappningar och det stora antalet potentiella avsikter minskade modellens effektivitet. Tydligt för Hits@1, det striktaste måttet, som gav en märkbart lägre prestanda, 27, 9% med blickdata jämfört med 18, 6% utan. Trots dessa utmaningar visade resultaten att blickbeteende är en värdefull indikator för att reducera antalet möjliga avsikter och producera handlingsbara prediktioner. Innan den sista handlingen uppnådde modellen över 90% träffsäkerhet i bredare mått såsom Hit@5 och Hit@10, och 69, 8% för Hit@1, vilket visar dess förmåga att på ett tillförlitligt sätt fånga spelarens plan. Även om modellen är mindre konsekvent i att förutsäga den exakta handlingssekvensen tidigt i rundan, understryker den starka prestandan i bredare mått modellens potential att stöjda beslutsfattande genom att noterbart begränsa antalet möjliga avsikter, även i en komplex och dynamisk spelmiljö som denna. Slutligen begränsar den lilla datamängden möjligheten att uppnå statistisk signifikans, men de observerade trenderna ger värdefulla insikter och lyfter fram lovande riktningar för framtida forskning och tillämpningar. Detta inkluderar utforskning av större datamängder, dynamiska fixeringsmapp- ningsstrategier samt de många möjligheterna med VR-miljön, såsom att inkludera ytterligare modaliteter som tal och handgester för att förbättra modellens robusthet och praktiska tillämpning.
Place, publisher, year, edition, pages
2025. , p. 54
Series
TRITA-EECS-EX ; 2025:61
Keywords [en]
Intent Recognition, Gaze Behavior, Virtual Reality, Heuristic Planning, Board Game
Keywords [sv]
Avsiktsigenkänning, Blickbeteende, Virtuell Verklighet, Heuristisk Planering, Brädspel
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-361864OAI: oai:DiVA.org:kth-361864DiVA, id: diva2:1949077
Supervisors
Examiners
2025-04-082025-04-012025-04-23Bibliographically approved