kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Efficient and robust reduction of bounding boxes of a multi-class neural network’s output for vehicular radar-systems
KTH, School of Electrical Engineering and Computer Science (EECS).
2022 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Effektiva och robusta minskningar av avgränsande rutor för en flerklassig neurala nätverks utdata för radar-system för fordon (Swedish)
Abstract [en]

Object detection has been a fundamental part of many emerging technologies, such as autonomous vehicles, robotics, and security. As deep learning is the main reason behind the leap of performance in object detection, it has mostly been associated with a post-processing step of non-maximum suppression (NMS) to reduce the number of resulting bounding boxes output from the network to, ideally, one box per object. As non-maximum suppression blindly suppress the overlap with a pre-defined threshold, it introduces the problem of suppressing false negatives in crowded scenes by choosing a high threshold, or vice versa. This problem is critical, especially in the autonomous vehicle industry, as this concerns the safety of passengers. The problem of the machine understanding whether these bounding boxes belong to the same object or two near-by objects is still not directly solvable. Although a lot of previous research tried to invent a new box-reduction method, every method has its own drawbacks while solving the problem. That is why, until now, many researchers are still using non‐maximum suppression. In this research, a literature review was carried out to determine the best NMS alternatives. Then, an approach for box reduction based on determinantal point process (DPP) was implemented. Furthermore, an evaluation pipeline was introduced for experimental analysis for the differences between NMS and DPP. Although NMS shows a better performance in terms of precision and recall, DPP chooses better fitting bounding boxes.

Abstract [sv]

Objektdetektering har varit en grundläggande del av många nya tekniker, t.ex. autonoma fordon, robotik och säkerhet. Eftersom djupinlärning är den främsta orsaken till den stora prestandaskillnaden vid objektsdetektering har den oftast varit förknippad med ett efterbehandlingssteg med icke-maximal undertryckning (NMS) för att minska antalet resulterande avgränsande rutor som produceras av nätverket till, idealt sett, en ruta per objekt. Eftersom icke-maximal undertryckning blint undertrycker överlappningen med ett fördefinierat tröskelvärde, uppstår problemet med att undertrycka falskt negativa resultat i överfulla scener genom att välja ett högt tröskelvärde, eller tvärtom. Detta problem är kritiskt, särskilt inom industrin för autonoma fordon, eftersom det gäller passagerarnas säkerhet. Problemet med att maskinen ska förstå om dessa avgränsande rutor tillhör samma objekt eller två närliggande objekt är fortfarande inte direkt lösbart. Även om man i tidigare forskning har försökt hitta en ny metod för att reducera boxar, har varje metod sina egna nackdelar när den löser problemet. Det är därför som många forskare fram till nu fortfarande använder sig av icke-maximalt undertryckande. I denna forskning gjordes en litteraturstudie för att fastställa de bästa NMS-alternativen. Därefter implementerades en metod för boxförminskning baserad på determinant punktprocess (DPP). Dessutom infördes en utvärderingsledning för experimentell analys av skillnaderna mellan NMS och DPP. Även om NMS visar en bättre prestanda när det gäller precision och återkallande, väljer DPP bättre passande avgränsande lådor.

Place, publisher, year, edition, pages
2022. , p. 93
Series
TRITA-EECS-EX ; 2022:778
Keywords [en]
Non-maximum suppression, Deep Learning, Machine Learning, Autonomous Vehicles, Determinantal Point Process
Keywords [sv]
Icke-maximal undertryckning, Djupinlärning, Maskininlärning, Autonoma fordon, Determinant punktprocess
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-321928OAI: oai:DiVA.org:kth-321928DiVA, id: diva2:1713646
External cooperation
Aptiv
Supervisors
Examiners
Available from: 2023-01-24 Created: 2022-11-25 Last updated: 2023-01-24Bibliographically approved

Open Access in DiVA

fulltext(15863 kB)939 downloads
File information
File name FULLTEXT01.pdfFile size 15863 kBChecksum SHA-512
04a6cf347511aec874a622451e584a790db86e6bda2ccb90986fc2170666e1cdfd4dba0186b5cf74c9b0e2cb936d77274ba883fe9731389a1dbc42f8bbab3a1d
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 952 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 224 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf