kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Politisk trendanalys med hjälp av Natural Language Processing
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Political trend analysis using Natural Language Processing (English)
Abstract [en]

This paper investigates how Natural Language Processing, NLP, can be employed to identify and visualize trends and patterns in politics. As the volume of text-based data generated from various political processes grows, there is an increasing need for new tools to manage, process, and understand the information embedded in these text corpora. NLP provides a set of tools designed to analyze and understand human language using computers. In this research, NLP tools are applied to parliamentary speeches from 1993 to 2023. Initially, we examined how NLP can visualize and analyze changes in the overall semantic content of each party’s speeches over time using Doc2Vec and Principal Component Analysis (PCA). The results revealed significant trends and patterns, illustrating how the rhetorical styles of the parties have evolved over the years and in relation to each other. Furthermore, BERT was used with the clustering algorithm K-means to attempt to quantify changes in the sentiment of parliamentary speeches over the years. The analysis did not reveal clear patterns, prompting further exploration of the complexity of this issue and discussion on how alternative methods might provide more favorable conditions for this type of research. Finally, the opportunities arising from the technology are highlighted. Using the Blue Ocean Strategy framework, it is explained how actors in the field of political analysis can conduct more analyses than before and better adapt the platforms and methods used to disseminate their analyses, thereby attracting new customer segments.

Abstract [sv]

Detta arbete syftar till att undersöka hur Natural Language Processing, NLP, kan användas för att identifiera och visualisera trender och mönster inom politiken. I takt med att den genererade mängden textbaserad data från olika politiska processer växer ökar behovet av nya verktyg för att hantera, bearbeta och bygga förståelse för den information som ligger inbäddad i dessa textmängder. NLP tillhandahåller en uppsättning verktyg utformade för att analysera och förstå mänskligt språk med hjälp av datorer. I denna studie appliceras verktyg ur detta område på riksdagsanföranden mellan 1993 och 2023. Till att börja med undersöktes hur NLP kan användas för visualisering och analys av förändringen genom åren i övergripande semantik för varje partis anföranden. För detta användes Doc2Vec och PCA-analys. Visualiseringen visade på intressanta trender och mönster som ringar in hur partiernas sätt att uttrycka sig har förändrats genom åren. Vidare användes BERT tillsammans med klustringsalgoritmen K-means i ett försök att kvantifiera hur sentiment för riksdagsanföranden har förändrats genom åren. Resultaten visade inga tydliga mönster för denna fråga, istället diskuteras frågans komplexa natur samt hur andra tillvägagångssätt ger bättre förutsättningar för denna typ arbete. Slutligen motiveras de möjligheter som följer av tekniken. Med Blue Ocean Strategy som ramverk förklaras hur aktörer inom området för politisk analys kan genomföra fler analyser än tidigare, samt bättre anpassa de plattformar och metoder som används för att förmedla analyserna, vilket gör det möjligt att attrahera nya kundgrupper.

Place, publisher, year, edition, pages
2024. , p. 12
Series
TRITA-EECS-EX ; 2024:278
Keywords [en]
Machine Learning, NLP, Doc2Vec, BERT, PCA, Blue Oceans Strategy, Four Actions, Political Analysis
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-350821OAI: oai:DiVA.org:kth-350821DiVA, id: diva2:1885072
Supervisors
Examiners
Available from: 2024-08-13 Created: 2024-07-21 Last updated: 2024-08-13Bibliographically approved

Open Access in DiVA

fulltext(2487 kB)71 downloads
File information
File name FULLTEXT01.pdfFile size 2487 kBChecksum SHA-512
e56155e493d36ff73cee4a8c011edb7be16ca81d955655169b24b42e57f367f069403fa94faa4246eb2274478978feefff4574f4022bc7599d0bf37990bf7f34
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 71 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 192 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf