kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
From Text to Truth: Integrating Large Language Models for Accurate Fake News Detection: A in-depth study of different Deep Learning techniques
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Från text till sanning: Integration av storskaliga språkmodeller för identifiering av falska nyheter : En djupgående studie av olika djupinlärningstekniker (Swedish)
Abstract [en]

This thesis investigates the integration of Large Language Models (LLMs) with other machine learning techniques to enhance the detection and classification of Fake News. The proliferation of misinformation, primarily through social media, presents a critical challenge due to its potential impact on public opinion and societal trust. Disinformation is characterized by its complexity and adaptability, perpetuating the challenge of effectively mitigating its spread. The pressing need for more robust and adaptive tools to combat Fake News motivated the project. Traditional automated approaches often rely on standalone deep learning models. However, this thesis posits that hybrid models, which combine LLMs’ nuanced language understanding capabilities with the pattern recognition strengths of Convolutional Neural Networks (CNNs) and the sequence processing abilities of Long Short-Term Memory networks (LSTMs), could offer improvements. The thesis developed several novel hybrid architectures to explore this hypothesis, blending LLMs with CNNs and LSTMs in various configurations to harness their complementary strengths. Each model was engineered and tested to determine its efficacy, utilizing a dataset that presents multiple classes of Fake News. The models were evaluated based on accuracy and F1-score metrics to identify configurations that maximize performance. The findings reveal that these hybrid models set a new benchmark in accuracy for Fake News detection, outperforming existing models. This advancement demonstrates the feasibility of integrating LLMs with other machine learning approaches. It highlights the potential of such models to adapt and evolve in response to the changing landscape of disinformation. By establishing new state-of-the-art results, this thesis not only underscores the viability of hybrid models in real-world applications but also paves the way for future research that could further enhance these approaches. The integration of LLMs with other machine learning techniques, as demonstrated in this study, provides a powerful tool against the dissemination of Fake News, offering implications for the development of more informed and resilient public discourse platforms.

Abstract [sv]

Denna uppsats undersöker integreringen av stora Large Language Models (LLMs) med andra maskininlärningstekniker för att förbättra identifiering och klassificeringen av falska nyheter. Spridningen av desinformation, främst genom sociala medier, utgör en kritisk utmaning på grund påverkan den kan ha på allmän opinion och samhälleligt förtroende. Desinformation kännetecknas av sin komplexitet och anpassningsförmåga, vilket försvårar en effektiv begränsning av dess spridning. Det akuta behovet av mer robusta och adaptiva verktyg för att bekämpa falska nyheter var en motiverande faktor bakom detta projekt. Traditionella automatiserade metoder förlitar sig ofta på fristående djupinlärningsmodeller. Denna uppsats föreslår dock att hybrida modeller, som kombinerar LLMs nyanserade språkförståelseförmåga med Convolutional Neural Networks (CNNs) mönsterigenkänningsstyrkor och Long Short-Term Memory nätverks (LSTMs) sekvensbearbetningsförmågor, kan erbjuda förbättringar. I uppsatsen utvecklades flera nya hybrida arkitekturer för att utforska denna hypotes. Olik konfigurationer undersöktes genom att kombinera LLMs med CNNs och LSTMs för att utnyttja deras komplementära styrkor. Varje modell konstruerades och testades för att bedöma dess effektivitet, med användning av ett dataset som presenterar flera klasser av falska nyheter. Modellerna utvärderades baserat på Accuracy och F1-Score för att identifiera konfigurationer som maximerar prestandan. Resultaten visar att dessa hybrida modeller sätter en ny standard för Accuracy vid identifiering av falska nyheter och överträffar befintliga modeller. Denna framgång visar på möjligheten att integrera LLMs med andra maskininlärningsmetoder och betonar potentialen hos sådana modeller att anpassa sig och utvecklas i takt med den föränderliga desinformationslandskapet. Genom att etablera nya toppresultat I Accuracy understryker denna uppsats inte bara hybridmodellers genomförbarhet i praktiska tillämpningar, utan banar också väg för framtida forskning som kan förbättra dessa metoder ytterligare. Integreringen av LLMs med andra maskininlärningstekniker, som demonstreras i denna studie, erbjuder ett kraftfullt verktyg mot spridningen av falska nyheter och har betydelse för utvecklingen av mer informerade och motståndskraftiga plattformar för offentlig diskurs.

Place, publisher, year, edition, pages
2024. , p. 77
Series
TRITA-EECS-EX ; 2024:471
Keywords [en]
Fake News Detection, Large Language Models, Natural Language Processing, Text Classification, Convolutional Neural Networks, Long Short-Term Memory Networks
Keywords [sv]
Identifiering av Falska Nyheter, Stora Språkmodeller, Språkteknologi, Text Klassifiering, Konvolutionella Neurala Nätverk, Långt Korttidsminne
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-351584OAI: oai:DiVA.org:kth-351584DiVA, id: diva2:1887927
External cooperation
Knightec
Supervisors
Examiners
Available from: 2024-09-23 Created: 2024-08-09 Last updated: 2024-09-23Bibliographically approved

Open Access in DiVA

fulltext(1833 kB)281 downloads
File information
File name FULLTEXT01.pdfFile size 1833 kBChecksum SHA-512
d83cfa1fbaf8bc534c5a23adfead3d39cc72ef9e080df858f164d5a4c9bd8c4228ad75798b7ae366bfc22d82bd7d751d2a972aff727b34067f7d6029131203b3
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 281 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 291 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf