Change search
ReferencesLink to record
Permanent link

Direct link
Estimating 3D-trajectories from Monocular Video Sequences
KTH, School of Computer Science and Communication (CSC).
2015 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Estimering av 3D-banor från monokulära videosekvenser (Swedish)
Abstract [en]

Tracking a moving object and reconstructing its trajectory can be done with a stereo camera system, since the two cameras enable depth vision. However, such a system would not work if one of the cameras fails to detect the object. If that happens, it would be beneficial if the system could still use the functioning camera to make an approximate trajectory reconstruction.

In this study, I have investigated how past observations from a stereo system can be used to recreate trajectories when video from only one of the cameras is available. Several approaches have been implemented and tested, with varying results. The best method was found to be a nearest neighbors-search optimized by a Kalman filter. On a test set with 10000 golf shots, the algorithm was able to create estimations which on average differed around 3.5 meters from the correct trajectory, with better results for trajec-tories originating close to the camera.

Abstract [sv]

Att spåra ett objekt i rörelse och rekonstruera dess bana kan göras med ett stereokamerasystem, eftersom de två kamerorna möjliggör djupseende. Ett sådant system skulle dock inte fungera om en av kamerorna misslyckas med att detektera objektet. Om det händer skulle det vara fördelaktigt om systemet ändå kunde använda den fungerande kameran för att göra en approximativ rekonstruktion av banan.

I den här studien har jag undersökt hur tidigare observationer från ett stereosystem kan användas för att rekonstruera banor när video från enbart en av kamerorna är tillgänglig. Ett flertal metoder har implementerats och testats, med varierande resultat. Den bästa metoden visade sig vara en närmaste-grannar-sökning optimerad med ett Kalman-filter. På en testmängd bestående av 10000 golfslag kunde algoritmen skapa uppskattningar som i genomsnitt skiljde sig 3.5 meter från den korrekta banan, med bättre resultat för banor som startat nära kameran.

Place, publisher, year, edition, pages
Keyword [en]
3D-reconstruction, Monocular Vision, Machine Learning, Nearest Neighbors, Kalman Filter
Keyword [sv]
3D-rekonstruktion, Monokulärseende, Maskininlärning, Närmaste grannar, Kalman-filter
National Category
Computer Science
URN: urn:nbn:se:kth:diva-172919OAI: diva2:850599
Educational program
Master of Science in Engineering - Computer Science and Technology
Available from: 2015-09-10 Created: 2015-09-01 Last updated: 2015-09-10Bibliographically approved

Open Access in DiVA

fulltext(1523 kB)110 downloads
File information
File name FULLTEXT01.pdfFile size 1523 kBChecksum SHA-512
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 110 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 700 hits
ReferencesLink to record
Permanent link

Direct link