Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Curriculum learning for increasing the performance of a reinforcement learning agent in a static first-person shooter game
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2018 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)Alternativ titel
Användning av läroplanering för att öka prestandan hos en agent som lärs upp med förstärkt inlärning i ett förstapersonsskjutspel med en statisk spelare (Svenska)
Abstract [en]

In this thesis, we trained a reinforcement learning agent using one of the most recent policy gradient methods, proximal policy optimization, in a first-person shooter game with a static player. We investigated how curriculum learning can be used to increase performance of a reinforcement learning agent. Two reinforcement learning agents were trained in two different environments. The first environment was constructed without curriculum learning and the second environment was with curriculum learning. After training the agents, the agents were placed in the same environment where we compared them based on their performance. The performance was measured by the achieved cumulative reward. The result showed that there is a difference in performance between the agents. It was concluded that curriculum learning can be used to increase the performance of a reinforcement learning agent in a first-person shooter game with a static player.

Abstract [sv]

I denna uppsats tränade vi en agent genom förstärkt djupinlärning med hjälp av en av de senaste gradientmetoderna, nämligen proximal policy optimization, i ett förstapersonsskjutspel med en statisk spelare. Vi undersökte hur läroplanering kan användas för att öka prestandan hos en agent som tränats med förstärkt inlärning. Två agenter tränades i två olika miljöer. Den första miljön använde inte läroplanering och den andra miljön använde läroplanering. Efter att ha tränat agenterna placerades de i samma miljö. Deras prestation mättes genom deras kumulativa belöning. Reslutatet påvisade att det finns en skillnad i prestanda mellan agenterna. Genom att använda läroplanering i ett förstapersonsskjutspel med en statisk spelare kunde prestandan hos en agent som tränats med förstärkt inlärning öka.

Ort, förlag, år, upplaga, sidor
2018. , s. 43
Serie
TRITA-EECS-EX ; 2018:633
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:kth:diva-236462OAI: oai:DiVA.org:kth-236462DiVA, id: diva2:1256486
Handledare
Examinatorer
Tillgänglig från: 2018-10-17 Skapad: 2018-10-17 Senast uppdaterad: 2018-10-17Bibliografiskt granskad

Open Access i DiVA

fulltext(1825 kB)162 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1825 kBChecksumma SHA-512
167786a6927f7ea536f8a51aae4011b014bed3ba69850bd9e85be7877b753a8fba92496b8a57b4c1e353970b40c70d07acb4cbd2ecf56b767110ef90940e0ea2
Typ fulltextMimetyp application/pdf

Av organisationen
Skolan för elektroteknik och datavetenskap (EECS)
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 162 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 556 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf