Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
From Text to Truth: Integrating Large Language Models for Accurate Fake News Detection: A in-depth study of different Deep Learning techniques
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2024 (engelsk)Independent thesis Advanced level (degree of Master (Two Years)), 20 poäng / 30 hpOppgaveAlternativ tittel
Från text till sanning: Integration av storskaliga språkmodeller för identifiering av falska nyheter : En djupgående studie av olika djupinlärningstekniker (svensk)
Abstract [en]

This thesis investigates the integration of Large Language Models (LLMs) with other machine learning techniques to enhance the detection and classification of Fake News. The proliferation of misinformation, primarily through social media, presents a critical challenge due to its potential impact on public opinion and societal trust. Disinformation is characterized by its complexity and adaptability, perpetuating the challenge of effectively mitigating its spread. The pressing need for more robust and adaptive tools to combat Fake News motivated the project. Traditional automated approaches often rely on standalone deep learning models. However, this thesis posits that hybrid models, which combine LLMs’ nuanced language understanding capabilities with the pattern recognition strengths of Convolutional Neural Networks (CNNs) and the sequence processing abilities of Long Short-Term Memory networks (LSTMs), could offer improvements. The thesis developed several novel hybrid architectures to explore this hypothesis, blending LLMs with CNNs and LSTMs in various configurations to harness their complementary strengths. Each model was engineered and tested to determine its efficacy, utilizing a dataset that presents multiple classes of Fake News. The models were evaluated based on accuracy and F1-score metrics to identify configurations that maximize performance. The findings reveal that these hybrid models set a new benchmark in accuracy for Fake News detection, outperforming existing models. This advancement demonstrates the feasibility of integrating LLMs with other machine learning approaches. It highlights the potential of such models to adapt and evolve in response to the changing landscape of disinformation. By establishing new state-of-the-art results, this thesis not only underscores the viability of hybrid models in real-world applications but also paves the way for future research that could further enhance these approaches. The integration of LLMs with other machine learning techniques, as demonstrated in this study, provides a powerful tool against the dissemination of Fake News, offering implications for the development of more informed and resilient public discourse platforms.

Abstract [sv]

Denna uppsats undersöker integreringen av stora Large Language Models (LLMs) med andra maskininlärningstekniker för att förbättra identifiering och klassificeringen av falska nyheter. Spridningen av desinformation, främst genom sociala medier, utgör en kritisk utmaning på grund påverkan den kan ha på allmän opinion och samhälleligt förtroende. Desinformation kännetecknas av sin komplexitet och anpassningsförmåga, vilket försvårar en effektiv begränsning av dess spridning. Det akuta behovet av mer robusta och adaptiva verktyg för att bekämpa falska nyheter var en motiverande faktor bakom detta projekt. Traditionella automatiserade metoder förlitar sig ofta på fristående djupinlärningsmodeller. Denna uppsats föreslår dock att hybrida modeller, som kombinerar LLMs nyanserade språkförståelseförmåga med Convolutional Neural Networks (CNNs) mönsterigenkänningsstyrkor och Long Short-Term Memory nätverks (LSTMs) sekvensbearbetningsförmågor, kan erbjuda förbättringar. I uppsatsen utvecklades flera nya hybrida arkitekturer för att utforska denna hypotes. Olik konfigurationer undersöktes genom att kombinera LLMs med CNNs och LSTMs för att utnyttja deras komplementära styrkor. Varje modell konstruerades och testades för att bedöma dess effektivitet, med användning av ett dataset som presenterar flera klasser av falska nyheter. Modellerna utvärderades baserat på Accuracy och F1-Score för att identifiera konfigurationer som maximerar prestandan. Resultaten visar att dessa hybrida modeller sätter en ny standard för Accuracy vid identifiering av falska nyheter och överträffar befintliga modeller. Denna framgång visar på möjligheten att integrera LLMs med andra maskininlärningsmetoder och betonar potentialen hos sådana modeller att anpassa sig och utvecklas i takt med den föränderliga desinformationslandskapet. Genom att etablera nya toppresultat I Accuracy understryker denna uppsats inte bara hybridmodellers genomförbarhet i praktiska tillämpningar, utan banar också väg för framtida forskning som kan förbättra dessa metoder ytterligare. Integreringen av LLMs med andra maskininlärningstekniker, som demonstreras i denna studie, erbjuder ett kraftfullt verktyg mot spridningen av falska nyheter och har betydelse för utvecklingen av mer informerade och motståndskraftiga plattformar för offentlig diskurs.

sted, utgiver, år, opplag, sider
2024. , s. 77
Serie
TRITA-EECS-EX ; 2024:471
Emneord [en]
Fake News Detection, Large Language Models, Natural Language Processing, Text Classification, Convolutional Neural Networks, Long Short-Term Memory Networks
Emneord [sv]
Identifiering av Falska Nyheter, Stora Språkmodeller, Språkteknologi, Text Klassifiering, Konvolutionella Neurala Nätverk, Långt Korttidsminne
HSV kategori
Identifikatorer
URN: urn:nbn:se:kth:diva-351584OAI: oai:DiVA.org:kth-351584DiVA, id: diva2:1887927
Eksternt samarbeid
Knightec
Veileder
Examiner
Tilgjengelig fra: 2024-09-23 Laget: 2024-08-09 Sist oppdatert: 2024-09-23bibliografisk kontrollert

Open Access i DiVA

fulltext(1833 kB)314 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 1833 kBChecksum SHA-512
d83cfa1fbaf8bc534c5a23adfead3d39cc72ef9e080df858f164d5a4c9bd8c4228ad75798b7ae366bfc22d82bd7d751d2a972aff727b34067f7d6029131203b3
Type fulltextMimetype application/pdf

Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 314 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 371 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf