kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Interaction Aware Decision Making for Automated Vehicles Based on Reinforcement Learning
KTH, School of Electrical Engineering and Computer Science (EECS).
2022 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Decision-making is one of the key challenges blocking full autonomy of automated vehicles. In highway scenarios, automated vehicles are expected to be aware of their surroundings and make decisions by interacting with other road participants to drive safely and efficiently. In this thesis, one and multistep lookahead rollout algorithm and its variants are applied to address this problem. The results are evaluated using metrics related to safety and efficiency and compared with the DQN baseline. To improve the collision-avoidance performance of the ego-vehicle, I combine the idea of fortified rollout and rollout with multiple heuristics and propose the safe rollout method for the decision-making problem of automated vehicles. The experimental results show that the rollout agents have decent decision-making performance and can outperform the DQN baseline by collecting higher total reward. Experiments are also conducted to investigate the agent’s ability to adapt to varying behaviour of surrounding vehicles, as well as the impact of different horizon and reward function setting. The difference between deterministic and stochastic problems and its impact on the performance of different rollout agents is discussed. Two approaches to implement data-driven simulation are presented, and the feasibility of utilizing these data-driven simulator as control and decision support is investigated.

Abstract [sv]

Beslutsfattande är en av de viktigaste utmaningarna som blockerar full autonomi för automatiserade fordon. I motorvägsscenarier, förväntas automatiserade fordon att vara medvetna om sin omgivning och fatta beslut genom att samspela med andra vägdeltagare för att köra säkert och effektivt. I den här avhandlingen tillämpas en och flerstegs lookahead-utrullningsalgoritm och dess varianter för att lösa detta problem. Resultaten utvärderas med hjälp av mått relaterade till säkerhet och effektivitet och jämförs med DQN-baslinjen. För att förbättra ego-fordonets kollisionsundvikande prestanda kombinerar jag idén om förstärkt utrullning och utrullning med flera heuristiker och föreslår den säkra utrullningsmetoden för beslutsfattande problem med automatiserade fordon. De experimentella resultaten visar att utrullningsagenterna har rimligt beslutsfattande prestanda och kan prestera bättre än DQN-baslinjen med högre total belöning. Experiment genomförs också för att undersöka agentens förmåga att anpassa sig till olika beteenden hos omgivande fordon, samt påverkan av olika horisont- och belöningsfunktionsinställningar. Skillnaden mellan deterministiska och stokastiska problem och dess inverkan på prestandan hos olika utrullningsagenter diskuteras. Två tillvägagångssätt för att implementera datadriven simulering presenteras, och möjligheten att använda dessa datadrivna simulatorer som styr- och beslutsstöd undersöks.

Place, publisher, year, edition, pages
2022. , p. 65
Series
TRITA-EECS-EX ; 2022:721
Keywords [en]
Reinforcement Learning, Automated Vehicles, Decision-making, Rollout, Driver Behaviour Modeling, Trajectory Prediction
Keywords [sv]
Förstärkningsinlärning, automatiserade fordon, beslutsfattande, utrullning, modellering av förarbeteende, banförutsägelse
National Category
Electrical Engineering, Electronic Engineering, Information Engineering
Identifiers
URN: urn:nbn:se:kth:diva-321527OAI: oai:DiVA.org:kth-321527DiVA, id: diva2:1711482
Subject / course
Systems Engineering
Educational program
Master of Science - Systems, Control and Robotics
Supervisors
Examiners
Available from: 2022-12-19 Created: 2022-11-17 Last updated: 2022-12-19Bibliographically approved

Open Access in DiVA

fulltext(1425 kB)423 downloads
File information
File name FULLTEXT01.pdfFile size 1425 kBChecksum SHA-512
0899585b93c5bb8d04361380fb33f484a929aadc76e08ff2fb1550f3af9aa5a19e5cf2bda9b76f77cc7da76261f43413e3f757adb13201686f0f2c1cb74ca7a2
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Electrical Engineering, Electronic Engineering, Information Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 423 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 654 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf