Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Visual Attention using 3D Context.
KTH, School of Computer Science and Communication (CSC).
2012 (English)Independent thesis Advanced level (professional degree), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Visual Attention using 3D Context

Johan Ekekrantz

Humans use context information every day for visual detection of objects. In the case of robots, most object detection algorithms ignore the information that the context of an object can provide. In this report we aim to exploit the 3D context of objects to determine the regions in an image where a certain class of objects might occur. This is achieved by using a depth-frame fetched from a Microsoft Kinect sensor combined with machine learning techniques such as support vector-machines, k-means clustering and gradient-descent based boosting. The results of the proposed algorithm are then evaluated with two quantitative techniques.

Abstract [sv]

Visuell uppmärksamhet med hjälp av 3D-kontext

Av: Johan Ekekrantz

När det moderna samhället förväntar sig mer komplexa beteenden av robotar ökar vikten av att robotar på ett effektivt sett kan analysera och känna igen sig i sin miljö. Mänskliga miljöer är ofta mycket strukturerade. Böcker tenderar att vara i bokhyllor och papperskorgar hittas ofta på golvnivå. Denna typ av kunskap kallas ofta kontextuell information och används flitigt av människor. I denna rapport studerar vi en metod för att ge robotar möjligheten att använda kontextuell information. Tidigare forskning i ämnet har använt sig av visuell information i form av bilder. I denna rapport använder vi oss av djupdata insamlat med hjälp av en Microsoft Kinect. För att tolka datan använder vi oss av maskininlärningsalgoritmer så som Support-vector regression, boosting och k-means clustering. Metoden analyseras sedan både kvantitativt och kvalitativt.

Place, publisher, year, edition, pages
2012.
Series
Trita-CSC-E, ISSN 1653-5715 ; 2012:011
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-130932OAI: oai:DiVA.org:kth-130932DiVA: diva2:654378
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.nada.kth.se/utbildning/grukth/exjobb/rapportlistor/2012/rapporter12/ekekrantz_johan_12011.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 91 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf