4546474849505148 of 204
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Deep Active Learning for 3D Object Detection for Autonomous Driving
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Djup aktiv inlärning för 3D-objektdetektion vid autonom körning (Swedish)
Abstract [en]

3D object detection is vital for autonomous driving. However, to train a 3D detector often requires a huge amount of labeled data which are extremely expensive and tedious to obtain. In order to alleviate the annotation effort while maintaining detection performance, we aim to adopt active learning framework for training a 3D object detector with the least amount of labeled data. In contrast with the conventional passive learning that a machine learning model is trained on a pre-determined training dataset, active learning allows the model to actively select the most informative samples for labeling and add them to the training set. Therefore, only a fraction of data need to be labeled. To the best of our knowledge, this thesis is the first that studies active learning for 3D detection.

We take progressive steps towards the goal. There are three stages with increasingly complex models and learning tasks. First, we start with active learning for image classification which can be viewed as a sub-problem of object detection. Second, we investigate and build a multi-task active learning framework with a deep refinement network for multi-modal 3D object detection. Lastly, we further analyze multi-task active learning with a more complicated two-stage 3D LiDAR vehicle detector. In our experiments, we study the fundamental and important aspects of an active learning framework with an emphasis on evaluating several popular data selection strategies based on prediction uncertainty. Without bells and whistles, we successfully propose an active learning framework for 3D object detection using 3D LiDAR point clouds and accurate 2D image proposals that saves up to 60% of labeled data on a public dataset. In the end, we also discuss some underlying challenges on this topic from both academic and industrial perspectives.

Abstract [sv]

Detektering av 3D-objekt är avgörande för autonom körning. För att träna en 3D-detektor krävs emellertid ofta en enorm mängd märkta data som är extremt dyra och omständiga att erhålla. För att underlätta anteckningsarbetet samtidigt som detekteringsprestanda bibehålls, använder vi ett aktivt lärande ramverk för att träna en 3Dobjektdetektor med minsta mängd märkta data. I motsats till den konventionella passiva inlärningen som en maskininlärningsmodell tränas på i ett förutbestämt träningsdataset, tillåter aktiv inlärning modellen att aktivt välja de mest informativa proverna för märkning och lägga till dem i träningsuppsättningen. Därför behöver bara en bråkdel av data märkas. Såvitt vi vet är detta examensarbete det första som studerar aktivt lärande för 3D-upptäckt.

Vi tar steg mot målet. Det finns tre steg med allt mer komplexa modeller och inlärningsuppgifter. Vi börjar med aktivt lärande för bildklassificering som kan ses som ett delproblem för objektdetektering. För det andra undersöker och bygger vi ett multiverksamhetslärande ramverk med ett djupt förfiningsnätverk för upptäckt av flermodala 3D-objekt. Slutligen analyserar vi ytterligare flerfunktionsaktivt lärande med en mer komplicerad tvåstegs 3D-LiDAR fordonsdetektor. I våra experiment studerar vi de grundläggande och viktiga aspekterna av ett aktivt inlärningsramverk med tonvikt på att utvärdera flera populära datavalsstrategier baserade på förutsägelsosäkerhet. Vi föreslår framgångsrikt ett aktivt inlärningsramverk för 3D-objektdetektering med 3D-LiDAR punktmoln och exakta 2D-bildförslag som sparar upp till 60% av märkta data i ett offentligt dataset. Till slut diskuterar vi också några underliggande utmaningar i detta ämne ur både akademiska och industriella perspektiv.

Place, publisher, year, edition, pages
2019. , p. 64
Series
TRITA-EECS-EX ; 2019:798
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-271193OAI: oai:DiVA.org:kth-271193DiVA, id: diva2:1415945
Educational program
Master of Science - Systems, Control and Robotics
Supervisors
Examiners
Available from: 2020-03-20 Created: 2020-03-20 Last updated: 2020-03-20Bibliographically approved

Open Access in DiVA

fulltext(28313 kB)7 downloads
File information
File name FULLTEXT01.pdfFile size 28313 kBChecksum SHA-512
8a9c208b651b453153d48e66ee2e754daf909be1ff7be3ce81db932733eee9e27892332c962940b96396f33e2d543c5fc0bfc714ad441a4d3c3fff149631fe05
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 7 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 26 hits
4546474849505148 of 204
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf