Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Designing a Question Answering System in the Domain of Swedish Technical Consulting Using Deep Learning
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2018 (engelsk)Independent thesis Advanced level (degree of Master (Two Years)), 20 poäng / 30 hpOppgaveAlternativ tittel
Design av ett frågebesvarande system inom svensk konsultverksamhet med användning av djupinlärning (svensk)
Abstract [en]

Question Answering systems are greatly sought after in many areas of industry. Unfortunately, as most research in Natural Language Processing is conducted in English, the applicability of such systems to other languages is limited. Moreover, these systems often struggle in dealing with long text sequences.

This thesis explores the possibility of applying existing models to the Swedish language, in a domain where the syntax and semantics differ greatly from typical Swedish texts. Additionally, the text length may vary arbitrarily. To solve these problems, transfer learning techniques and state-of-the-art Question Answering models are investigated. Furthermore, a novel, divide-and-conquer based technique for processing long texts is developed.

Results show that the transfer learning is partly unsuccessful, but the system is capable of perform reasonably well in the new domain regardless. Furthermore, the system shows great performance improvement on longer text sequences with the use of the new technique.

Abstract [sv]

System som givet en text besvarar frågor är högt eftertraktade inom många arbetsområden. Eftersom majoriteten av all forskning inom naturligtspråkbehandling behandlar engelsk text är de flesta system inte direkt applicerbara på andra språk. Utöver detta har systemen ofta svårt att hantera långa textsekvenser.

Denna rapport utforskar möjligheten att applicera existerande modeller på det svenska språket, i en domän där syntaxen och semantiken i språket skiljer sig starkt från typiska svenska texter. Dessutom kan längden på texterna variera godtyckligt. För att lösa dessa problem undersöks flera tekniker inom transferinlärning och frågebesvarande modeller i forskningsfronten. En ny metod för att behandla långa texter utvecklas, baserad på en dekompositionsalgoritm.

Resultaten visar på att transfer learning delvis misslyckas givet domänen och modellerna, men att systemet ändå presterar relativt väl i den nya domänen. Utöver detta visas att systemet presterar väl på långa texter med hjälp av den nya metoden.

sted, utgiver, år, opplag, sider
2018.
Serie
TRITA-EECS-EX ; 2018:322
Emneord [en]
Question Answering, Deep Learning, Machine Learning, Transfer Learning, Natural Language Processing, Technical Consulting, Word Embeddings, Divide and Conquer
HSV kategori
Identifikatorer
URN: urn:nbn:se:kth:diva-231586OAI: oai:DiVA.org:kth-231586DiVA, id: diva2:1229461
Eksternt samarbeid
Aiwizo AB
Utdanningsprogram
Master of Science in Engineering -Engineering Physics
Veileder
Examiner
Tilgjengelig fra: 2018-08-14 Laget: 2018-06-30 Sist oppdatert: 2018-08-14bibliografisk kontrollert

Open Access i DiVA

fulltext(2290 kB)220 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 2290 kBChecksum SHA-512
727203c289652dda4af7177dd01f82da788281dab07bf7ca8aa0016ea1e93d2ad4aa20e5fb8242b83359eb73b697a42bea673503646ee94a96401127fea8c171
Type fulltextMimetype application/pdf

Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 220 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 949 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf