Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Multi-Agent Control in Warehousing: A Deep Q-Network Approach
KTH, Skolan för elektroteknik och datavetenskap (EECS).
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2023 (engelsk)Independent thesis Basic level (degree of Bachelor), 10 poäng / 15 hpOppgave
Abstract [en]

With an increase in consumption, warehouses increase in size and demand for fastdistribution of goods. One solution to this problem is self learning robots that can adapt toany warehouse. This project implements the Deep Reinforcement Learning (DRL) algorithmDeep Q-Network (DQN) to a simulated warehouse in order to achieve close to optimalperformance. In order to verify the functionality of the written DQN algorithm, animplementation on a small single agent environment was conducted. After sufficient learningcapabilities were proven, a multi-agent system was developed. During training the multi-agent implementation showed promising returns and few collisions with other agents andwalls. When testing the trained systems, agents trained in small environments receivedlarger returns than those trained in a larger environment. Although the developed DQNstructure indicated learning capabilities, improvements can be made.

Abstract [sv]

Med ökande konsumtion ökar även storleken av lagerlokaler och kravet på en ökaddistribution av varor. En lösning till detta problem är självlärande robotar som kan anpassasig till vilken lagerlokal som helst. Det här projektet implementerar Deep ReinforcementLearning (DRL) algoritmen Deep Q-network (DQN) i en simulerad lagerlokal för att kunnauppnå nära inpå optimal prestanda. För att kunna verifiera att den skrivna DQN algoritmenfungerar som den ska, implementeras den på en liten miljö med en agent. Efter uppvisadtillräcklig inlärningsförmåga, utvecklades ett multi-agent system. Under inlärning visadesystemet lovande resultat och få krockar med andra agenter och väggar. När de tränadesystemen testades, gav de som tränats i en mindre miljö bättre resultat än de som tränats ien stor miljö. Även om DQN algoritmen visade inlärningsförmågor, finns potentiellaförbättringar.

sted, utgiver, år, opplag, sider
2023. , s. 123-129
Serie
TRITA-EECS-EX ; 2023:144
HSV kategori
Identifikatorer
URN: urn:nbn:se:kth:diva-341487OAI: oai:DiVA.org:kth-341487DiVA, id: diva2:1821887
Veileder
Examiner
Prosjekter
Kandidatexjobb i elektroteknik 2023, KTH, StockholmTilgjengelig fra: 2023-12-21 Laget: 2023-12-21

Open Access i DiVA

fulltext(211487 kB)31 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 211487 kBChecksum SHA-512
69786101c351a58f7bd524c3aeee40c661028b577366c4a725033372b88c624c87c2183b6acca2d3d43bbd2bb2f3942326c69263e70c99cf1db027ce9c4e9ae2
Type fulltextMimetype application/pdf

Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 31 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 132 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf