Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Analysis of Twitter data from the 2018 Swedish elections
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Analys av Twitter data från svenska riksdagsvalet 2018 (Swedish)
Abstract [en]

The increased usage of social media among the population has meant that more people share their thoughts about different topics on the Internet. The increased social media usage has made it interesting to investigate if data from social media can be used to get an understanding for why different events oc- cur. Elections is one such event where social media data could be used to get a better understanding of the final election results. The problem that is studied in this thesis is if Twitter data collected up to the Swedish elections in 2018 could be a useful source of information for predicting the final election results. The purpose of the thesis is to provide more knowledge about how real-world events are related to Twitter data.A comparative study was conducted where experiments carried out by Dokoohaki et al. [1] were repeated on a data set consisting of Tweets from the Swedish 2018 elections. The experiments carried out were based on the- ory from the areas of topic modeling and link predictions. Word embeddings were used in new experiments with the intent to form clusters around topics related to the elections. The experiments provided an estimation of the size of different topics on Twitter in relation to the elections.The results are that the clusters formed from the collected Twitter data provide some insight about the final election outcomes. With the clusters it is possible to identify which three parties would receive the largest amount of support in the elections.The conclusions of the study are that Twitter data can provide some expla- nations for why certain events happen. Due to the nature of Twitter data being noisy it is not possible to draw strong conclusion or make predictions on the exact voting outcomes for each party in the elections.

Abstract [sv]

En ökande användning av sociala medier har inburit att fler människor delar sina tankar om olika ämnen på Internet. Den ökade användningen har gjort det intressant att undersöka om data från sociala medier kan användas för att få för- ståelse för varför olika händelser inträffar. Val är en sådan händelse där sociala medier kan användas för att finna skäl till det slutliga valresultatet. Problemet som studeras i den här studien är om Twitter-data som samlas in månaderna förre det svenska riksdagsvalet 2018 kan vara en användbar informationskälla för att förutse slutresultatet. Syftet med studien är att ge mer kunskap om hur olika typer av händelser är relaterade till Twitter-data.En jämförande studie genomfördes där experiment utförda av Dokoohaki et al. [1] upprepades på ett dataset bestående av Tweets från det svenska riks- dagsvalet 2018. Experimenten som utfördes grundades på teori från områdena topic modeling och link predictions. Word-embeddings användes i nya expe- riment med avsikten att bilda kluster kring ämnen som är relaterade till valet. Experimenten gav en uppskattning av storleken på olika ämnen på Twitter i förhållande till valet.Resultatet från studien är att de kluster som bildats från den samlade Twitter- datan ger en viss insikt om de slutliga valresultaten. Med klusterna är det möj- ligt att identifiera vilka som skulle bli de tre partierna som skulle få flest antal röster i valet.Slutsatserna av de utförda experimenten är att Twitter-data kan ge möjliga förklarningar för varför vissa händelser inträffar. På grund av att Twitter-data innehåller mycket irrelevant information är det inte möjligt att dra starka slut- satser för vilket det exakta slutgiltiga valresultatet skulle bli.

Place, publisher, year, edition, pages
2019. , p. 75
Series
TRITA-EECS-EX ; 2019:162
Keywords [en]
Topic modeling, Link predictions, Twitter, Word embeddings, Elections
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-253004OAI: oai:DiVA.org:kth-253004DiVA, id: diva2:1322764
Examiners
Available from: 2019-06-11 Created: 2019-06-11 Last updated: 2019-06-11Bibliographically approved

Open Access in DiVA

No full text in DiVA

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 64 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf