Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Building a 3D Map from RGB-D Sensors.
KTH, School of Computer Science and Communication (CSC).
2012 (English)Independent thesis Advanced level (professional degree), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Building a 3D map from RGB-D sensors

By Virgile Högman

Master Thesis

For a mobile robot exploring an unknown static environment, localizing itself and building a map at the same time is a chicken-or-egg problem, known as Simultaneous Localization And Mapping (SLAM).

When a GPS receiver cannot be used, typically in indoor environment, the measurements are generally provided by laser rangefinders and stereo cameras, but they are expensive and standard laser rangefinders offer only 2D cross sections. However, recently there has been a great interest in processing data acquired using depth measuring sensors due to the availability of cheap and performant RGB-D cameras. For instance, the Kinect developed by Prime Sense and Microsoft has considerably changed the situation, providing a 3D camera at a very affordable price.

In this study, we will see how a 3D map based on a graphical model can be built by tracking visual features like SIFT/SURF, computing geometric transformations with RANSAC, and applying non-linear optimization techniques to estimate the trajectory. This can be done from a sequence of video frames combined with the depth information, using exclusively the Kinect, so the field of applications can be wider than robotics.

Abstract [sv]

En robot som utforskar en okänd statisk miljö, där den inte bara ska lokalisera sig utan också skapa en karta på samma gång, måste hantera det problem som benämns Simultaneous Localization And Mapping (SLAM).

När en GPS-mottagare inte kan användas, typiskt i en inomhus-miljö, brukar laseravståndsmätare och kameror andvändas som sensorer. En laseravståndsmätare är dyr och erbjuder information enbart i 2D. Kameror kräver mycket databehandling eftersom de inte tillhandahåller djupinformationDet har på sistone vuxit fram ett stort intresse för behandling av data från RGB-D kameror, dvs kameror som utöver den vanliga bilden ger djupinformation. Nyligen blev Kinect, utvecklad av Prime Sense och Microsoft, tillgänglig. Kinect erbjuder en RGB-D data till ett väldigt attraktivt pris.

I denna rapport studerar vi hur man kan skapa en 3D karta baserad på en grafisk model genom att spåra visuella landmärken från tex SIFT/SURF, beräkna geometriska transformationer med RANSAC, och applicera icke-linjära optimeringstekniker för att skatta hur sensorn rört sig. Vi visar hur vi kan använda en vanlig Kinect till detta utan några andra sensorer på roboten som annars ofta är fallet. Detta innebär att tillämpningsområdet kan vara bredare än robotik.

Place, publisher, year, edition, pages
2012.
Series
Trita-CSC-E, ISSN 1653-5715 ; 2012:014
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-130950OAI: oai:DiVA.org:kth-130950DiVA: diva2:654396
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.nada.kth.se/utbildning/grukth/exjobb/rapportlistor/2012/rapporter12/hogman_virgile_12014.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 353 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf