Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Automatisk klassificering av åsikter.
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2012 (Swedish)Independent thesis Advanced level (professional degree), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

The Internet is full of opinions. Reading an opinionated text and judging the authors stance is something humans are generally expected to be able to do. In this report, the authors build and test a computer system able to read movie reviews and judge the authors opinion of the film, thereby being able to give numerical grades to any film that has a decent number of reviews. The authors try different machine learning algorithms to judge which is best suited for this task, and compare the results to numerical movie grades found on the Internet Movie Database(IMDb). The algorithm Voted Perceptron comes out the winner, and the system built (named Judge Dr Film) manages to judge films quite close to their IMDb scores. The full source code can be found [1]on github.

Abstract [sv]

Internet är fullt av åsikter, och för en människa är det en enkel sak att läsa en recension eller ett blogginlägg och få en bild av författarens åsikt. För en dator är det dock en annan historia, och i den här rapporten undersöker författarna huruvida ett system kan skapas som automatiskt kan hämta avkoda filmrecensioner från internet och översätta dem till ett numeriskt betyg för filmen. Författarna testar tre olika maskininlärningsalgoritmer för denna uppgift, och jämför deras resultat med numeriska betyg som hämtas från Internet Movie Database, IMDb. Algoritmen Voted Perceptron är den som fungerar bäst med denna mätmetod, och betygen som sätts av systemet hamnar mycket nära IMDb-betygen. Den kompletta källkoden till programmet kan hittas [1]på github.

Place, publisher, year, edition, pages
2012.
Series
Kandidatexjobb CSC, K12009
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-131014OAI: oai:DiVA.org:kth-131014DiVA: diva2:654460
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.csc.kth.se/utbildning/kandidatexjobb/datateknik/2012/rapport/arvidsson_jens_OCH_strom_simon_K12009.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 159 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf