Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
A Data-Driven Semantic Parser for Spoken Route Descriptions.
KTH, School of Computer Science and Communication (CSC).
2012 (English)Independent thesis Advanced level (professional degree), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

The IURO project is an international multidisciplinary project with the aim to develop a robot that can autonomously navigate in unknown populated urban environments using passers-by as a source of knowledge in addition to sensory data.

The problem presented in this thesis is to devise, implement and evaluate a method for interpreting spoken route descriptions into conceptual route graphs. As part of the work, a format for conceptual route graphs is selected and a Concept Error Rate measure is introduced for assessing the performance of route graph interpretations. Additionally, a corpus of Swedish urban route descriptions is collected using a Wizard-of-Oz setting.

A data-driven approach is selected for implementing a semantic chunking parser, which divides each route description into conceptual chunks, which are attached to each other to form a hierarchical route graph. The proposed method is implemented and evaluated on the collected corpus, using different machine learning algorithms, including single layer perceptron networks.

The results show that the selected route graph representation is applicable and that the method is functional. The best machine learning algorithm performs significantly better than a majority class baseline. The results also indicate that most errors are introduced in the initial chunking process and that performance may be improved by the use of more data.

Abstract [sv]

IURO-projektet är ett internationellt, tvärvetenskapligt projekt vars mål är att utveckla en robot som självständigt kan navigera i okända befolkade stadsmiljöer genom att dra nytta av förbipasserande som en källa till kunskap att komplettera data från sensorer med.

Problemet som presenteras i denna examensarbetesrapport är att ta fram, implementera och utvärdera en metod för att tolka muntliga vägbeskrivningar för att framställa konceptuella ruttgrafer. Som en del av arbetet har ett corpus muntliga svenska vägbeskrivningar samlats in med Wizard of Oz-metodik, ett format för konceptuella ruttgrafer valts samt ett prestandamått för tolkningen av ruttgrafer, benämnt Concept Error Rate, tagits fram.

En datadriven strategi har tillämpats för att konstruera en semantisk uppdelande parser som delar upp varje vägbeskrivning i bitar baserat på koncept, vilka förbundna med varandra bildar en hierarkisk ruttgraf. Den föreslagna metoden genomförs och utvärderas på insamlat corpus med olika algoritmer för maskininlärning, däribland enlagers perceptronnätverk.

Resultaten visar att den valda representationen för ruttgrafer är tillämplig och att metoden är funktionell. Den bästa maskininlärningsalgoritmen presterar betydligt bättre än en baseline som följer majoritetsklassificering. Resultaten visar också att de flesta felen härrör från den inledande uppdelande processen, samt att prestanda lär förbättras vid användande av mer data.

Place, publisher, year, edition, pages
2012.
Series
Trita-CSC-E, ISSN 1653-5715 ; 2012:004
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-130951OAI: oai:DiVA.org:kth-130951DiVA: diva2:654397
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.nada.kth.se/utbildning/grukth/exjobb/rapportlistor/2012/rapporter12/johansson_martin_12004.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 31 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf