kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
BaziGooshi: A Hybrid Model of Reinforcement Learning for Generalization in Gameplay
KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap, Programvaruteknik och datorsystem, SCS.ORCID-id: 0000-0002-0638-7352
King.com Ltd, Stockholm, Sweden.
KTH, Skolan för elektroteknik och datavetenskap (EECS), Datavetenskap, Programvaruteknik och datorsystem, SCS.ORCID-id: 0000-0002-2748-8929
2024 (Engelska)Ingår i: IEEE Transactions on Games, ISSN 2475-1502, E-ISSN 2475-1510, Vol. 16, nr 3, s. 722-734Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

While reinforcement learning (RL) is gaining popularity in gameplay, creating a generalized RL model is still challenging. This study presents BaziGooshi, a generalized RL solution for games, focusing on two different types of games: 1) a puzzle game Candy Crush Friends Saga and 2) a platform game Sonic the Hedgehog Genesis. BaziGooshi rewards RL agents for mastering a set of intrinsic basic skills as well as achieving the game objectives. The solution includes a hybrid model that takes advantage of a combination of several agents pretrained using intrinsic or extrinsic rewards to determine the actions. We propose an RL-based method for assigning weights to the pretrained agents. Through experiments, we show that the RL-based approach improves generalization to unseen levels, and BaziGooshi surpasses the performance of most of the defined baselines in both games. Also, we perform additional experiments to investigate further the impacts of using intrinsic rewards and the effects of using different combinations in the proposed hybrid models.

Ort, förlag, år, upplaga, sidor
Institute of Electrical and Electronics Engineers (IEEE) , 2024. Vol. 16, nr 3, s. 722-734
Nyckelord [en]
Games, Color, Training, Green products, Encoding, Shape, Reinforcement learning, Deep reinforcement learning
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-355137DOI: 10.1109/TG.2024.3355172ISI: 001319570900012Scopus ID: 2-s2.0-85184322584OAI: oai:DiVA.org:kth-355137DiVA, id: diva2:1907731
Anmärkning

QC 20241023

Tillgänglig från: 2024-10-23 Skapad: 2024-10-23 Senast uppdaterad: 2025-08-28Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Person

Karimi, SaraPayberah, Amir H.

Sök vidare i DiVA

Av författaren/redaktören
Karimi, SaraPayberah, Amir H.
Av organisationen
Programvaruteknik och datorsystem, SCS
I samma tidskrift
IEEE Transactions on Games
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 77 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf