Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Improving deep monocular depth predictions using dense narrow field of view depth images
KTH, School of Electrical Engineering and Computer Science (EECS), Robotics, perception and learning, RPL.
2018 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

In this work we study a depth prediction problem where we provide a narrow field of view depth image and a wide field of view RGB image to a deep network tasked with predicting the depth for the entire RGB image. We show that by providing a narrow field of view depth image, we improve results for the area outside the provided depth compared to an earlier approach only utilizing a single RGB image for depth prediction. We also show that larger depth maps provide a greater advantage than smaller ones and that the accuracy of the model decreases with the distance from the provided depth. Further, we investigate several architectures as well as study the effect of adding noise and lowering the resolution of the provided depth image. Our results show that models provided low resolution noisy data performs on par with the models provided unaltered depth.

Abstract [sv]

I det här arbetet studerar vi ett djupapproximationsproblem där vi tillhandahåller en djupbild med smal synvinkel och en RGB-bild med bred synvinkel till ett djupt nätverk med uppgift att förutsäga djupet för hela RGB-bilden. Vi visar att genom att ge djupbilden till nätverket förbättras resultatet för området utanför det tillhandahållna djupet jämfört med en existerande metod som använder en RGB-bild för att förutsäga djupet. Vi undersöker flera arkitekturer och storlekar på djupbildssynfält och studerar effekten av att lägga till brus och sänka upplösningen på djupbilden. Vi visar att större synfält för djupbilden ger en större fördel och även att modellens noggrannhet minskar med avståndet från det angivna djupet. Våra resultat visar också att modellerna som använde sig av det brusiga lågupplösta djupet presterade på samma nivå som de modeller som använde sig av det omodifierade djupet.

Place, publisher, year, edition, pages
2018. , p. 63
Series
TRITA-EECS-EX ; 2018:621
Keywords [en]
Deep learning, Monocular, Depth estimation, Narrow field of view, RGB, RGBD, Noicy depth, Dense depth, Narrow depth, Sparse depth
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:kth:diva-235660OAI: oai:DiVA.org:kth-235660DiVA, id: diva2:1252502
Subject / course
Computer Science
Educational program
Master of Science in Engineering - Computer Science and Technology
Presentation
(English)
Supervisors
Examiners
Available from: 2018-10-08 Created: 2018-10-02 Last updated: 2018-10-08Bibliographically approved

Open Access in DiVA

Master_Thesis_Christoffer_Möckelind(52257 kB)28 downloads
File information
File name FULLTEXT01.pdfFile size 52257 kBChecksum SHA-512
dfb418590626e9d1b72364a9ec2eac141662a1fbc9300a3ccd1eafbf2bff27767d4267f7eb0d8c15631612a51c5c7ee5567accc47e32565dd1c9dd46cc186438
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Möckelind, Christoffer
By organisation
Robotics, perception and learning, RPL
Computer Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 28 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 118 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf