kth.sePublikationer KTH
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Mama Edha at SemEval-2017 Task 8: Stance Classification with CNN and Rules
KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS. FOI Swedish Defence Research Agency, FOI Swedish Defence Research Agency.ORCID-id: 0000-0002-0408-1421
FOI Swedish Defence Research Agency, FOI Swedish Defence Research Agency.
KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.ORCID-id: 0000-0002-1610-0917
FOI Swedish Defence Research Agency, FOI Swedish Defence Research Agency.
Antal upphovsmän: 42017 (Engelska)Ingår i: ACL 2017 - 11th International Workshop on Semantic Evaluations, SemEval 2017, Proceedings of the Workshop, Association for Computational Linguistics (ACL) , 2017, s. 481-485Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

For the competition SemEval-2017 we investigated the possibility of performing stance classification (support, deny, query or comment) for messages in Twitter conversation threads related to rumours. Stance classification is interesting since it can provide a basis for rumour veracity assessment. Our ensemble classification approach of combining convolutional neural networks with both automatic rule mining and manually written rules achieved a final accuracy of 74.9% on the competition's test data set for Task 8A. To improve classification we also experimented with data relabeling and using the grammatical structure of the tweet contents for classification.

Ort, förlag, år, upplaga, sidor
Association for Computational Linguistics (ACL) , 2017. s. 481-485
Nationell ämneskategori
Datavetenskap (datalogi) Språkbehandling och datorlingvistik
Identifikatorer
URN: urn:nbn:se:kth:diva-332056Scopus ID: 2-s2.0-85097656375OAI: oai:DiVA.org:kth-332056DiVA, id: diva2:1783103
Konferens
11th International Workshop on Semantic Evaluations, SemEval 2017, co-located with the 55th Annual Meeting of the Association for Computational Linguistics, ACL 2017, Vancouver, Canada, Aug 4 2017 - Aug 3 2017
Anmärkning

Part of ISBN 9781945626555

QC 20230719

Tillgänglig från: 2023-07-19 Skapad: 2023-07-19 Senast uppdaterad: 2025-02-01Bibliografiskt granskad
Ingår i avhandling
1. Toward automated veracity assessment of data from open sources using features and indicators
Öppna denna publikation i ny flik eller fönster >>Toward automated veracity assessment of data from open sources using features and indicators
2024 (Engelska)Doktorsavhandling, sammanläggning (Övrigt vetenskapligt)
Abstract [en]

This dissertation hypothesizes that the key to automated veracity assessment of data from open sources is the careful estimation and extraction of relevant features and indicators. These features and indicators provide added value to a quantifiable veracity assessment, either directly or indirectly. The importance and usefulness of a veracity assessment largely depend on the specific situation and reason for which it is being conducted. Factors such as the recipient of the veracity assessment, the scope of the assessment, and the metrics used to measure accuracy and performance, all play a role in determining the value and perceived quality of the assessment.

Five peer-reviewed publications; two journal articles, two conference articles, and one workshop article, are included in this compilation thesis.

The main contributions of the work presented in this dissertation are: i) a compilation of challenges with manual methods of veracity assessment, ii) a road map for addressing the identified challenges, iii) identification of the state-of-the-art and gap analysis of veracity assessment of open-source data, iv) exploration of indicators such as topic geo-location tracking over time and stance classification, and v) evaluation of various feature types, model transferability, and style obfuscation attacks and the impact on accuracy for automated veracity assessment of a type of deception: fake reviews.

Abstract [sv]

Denna avhandling har som hypotes att nyckeln till automatiserad trovärdighetsbedömning av data från öppna källor ligger i det noggranna urvalet och estimeringen av relevanta särdrag och indikatorer. Dessa särdrag och indikatorer ger ett direkt eller indirekt mervärde till en kvantifierbar trovärdighetsbedömning. Betydelsen och användbarheten av en trovärdighetsbedömning beror till stor del på den specifika kontexten och anledningen till att den genomförs. Faktorer som mottagaren av trovärdighetsbedömningen, omfattningen av bedömningen och de mått som används för att mäta noggrannhet och prestanda, spelar alla in för att bestämma värdet och den upplevda kvalitén på bedömningen.

Fem referentgranskade publikationer ingår i denna sammanläggningsavhandling; två tidskriftsartiklar, två konferensartiklar och en workshopartikel.

De huvudsakliga bidragen från arbetet som presenteras i denna avhandling är: i) en sammanställning av utmaningar relaterade till manuella metoder för trovärdighetsbedömning, ii) en plan för att ta itu med de identifierade utmaningarna, iii) identifiering av forskningsfronten och en gapanalys av trovärdighetsbedömning av data från öppna källor, iv) studie av indikatorer såsom geolokalisering av ämnen och spårning av dem över tid samt klassificering av individers reaktioner i inlägg på sociala medier, och v) en utvärdering av särdragstyper som påverkar noggrannheten för automatisk trovärdighetsbedömning applicerat på en typ av bedrägeri: falska recensioner.

Ort, förlag, år, upplaga, sidor
Stockholm, Sweden: KTH Royal Institute of Technology, 2024. s. 71
Serie
TRITA-EECS-AVL ; 2024:47
Nyckelord
Veracity assessment, natural language processing, machine learning, open-source data, Trovärdighetsbedömning, naturlig språkbehandling, maskininlärning, data från öppna källor
Nationell ämneskategori
Programvaruteknik
Forskningsämne
Informations- och kommunikationsteknik
Identifikatorer
urn:nbn:se:kth:diva-346353 (URN)978-91-8040-927-8 (ISBN)
Disputation
2024-06-03, https://kth-se.zoom.us/j/63226866138, Sal C, Kistagången 16, Stockholm, 13:30 (Engelska)
Opponent
Handledare
Anmärkning

QC 20240514

Tillgänglig från: 2024-05-14 Skapad: 2024-05-13 Senast uppdaterad: 2025-12-03Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Scopus

Person

García Lozano, MarianelaTjörnhammar, Edward

Sök vidare i DiVA

Av författaren/redaktören
García Lozano, MarianelaTjörnhammar, Edward
Av organisationen
Programvaruteknik och Datorsystem, SCS
Datavetenskap (datalogi)Språkbehandling och datorlingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 92 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf