Politisk trendanalys med hjälp av Natural Language Processing
2024 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesisAlternative title
Political trend analysis using Natural Language Processing (English)
Abstract [en]
This paper investigates how Natural Language Processing, NLP, can be employed to identify and visualize trends and patterns in politics. As the volume of text-based data generated from various political processes grows, there is an increasing need for new tools to manage, process, and understand the information embedded in these text corpora. NLP provides a set of tools designed to analyze and understand human language using computers. In this research, NLP tools are applied to parliamentary speeches from 1993 to 2023. Initially, we examined how NLP can visualize and analyze changes in the overall semantic content of each party’s speeches over time using Doc2Vec and Principal Component Analysis (PCA). The results revealed significant trends and patterns, illustrating how the rhetorical styles of the parties have evolved over the years and in relation to each other. Furthermore, BERT was used with the clustering algorithm K-means to attempt to quantify changes in the sentiment of parliamentary speeches over the years. The analysis did not reveal clear patterns, prompting further exploration of the complexity of this issue and discussion on how alternative methods might provide more favorable conditions for this type of research. Finally, the opportunities arising from the technology are highlighted. Using the Blue Ocean Strategy framework, it is explained how actors in the field of political analysis can conduct more analyses than before and better adapt the platforms and methods used to disseminate their analyses, thereby attracting new customer segments.
Abstract [sv]
Detta arbete syftar till att undersöka hur Natural Language Processing, NLP, kan användas för att identifiera och visualisera trender och mönster inom politiken. I takt med att den genererade mängden textbaserad data från olika politiska processer växer ökar behovet av nya verktyg för att hantera, bearbeta och bygga förståelse för den information som ligger inbäddad i dessa textmängder. NLP tillhandahåller en uppsättning verktyg utformade för att analysera och förstå mänskligt språk med hjälp av datorer. I denna studie appliceras verktyg ur detta område på riksdagsanföranden mellan 1993 och 2023. Till att börja med undersöktes hur NLP kan användas för visualisering och analys av förändringen genom åren i övergripande semantik för varje partis anföranden. För detta användes Doc2Vec och PCA-analys. Visualiseringen visade på intressanta trender och mönster som ringar in hur partiernas sätt att uttrycka sig har förändrats genom åren. Vidare användes BERT tillsammans med klustringsalgoritmen K-means i ett försök att kvantifiera hur sentiment för riksdagsanföranden har förändrats genom åren. Resultaten visade inga tydliga mönster för denna fråga, istället diskuteras frågans komplexa natur samt hur andra tillvägagångssätt ger bättre förutsättningar för denna typ arbete. Slutligen motiveras de möjligheter som följer av tekniken. Med Blue Ocean Strategy som ramverk förklaras hur aktörer inom området för politisk analys kan genomföra fler analyser än tidigare, samt bättre anpassa de plattformar och metoder som används för att förmedla analyserna, vilket gör det möjligt att attrahera nya kundgrupper.
Place, publisher, year, edition, pages
2024. , p. 12
Series
TRITA-EECS-EX ; 2024:278
Keywords [en]
Machine Learning, NLP, Doc2Vec, BERT, PCA, Blue Oceans Strategy, Four Actions, Political Analysis
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-350821OAI: oai:DiVA.org:kth-350821DiVA, id: diva2:1885072
Supervisors
Examiners
2024-08-132024-07-212024-08-13Bibliographically approved