Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Tovel: Distributed Graph Clustering for Word Sense Disambiguation
KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.
KTH, Skolan för informations- och kommunikationsteknik (ICT), Programvaruteknik och Datorsystem, SCS.
2017 (Engelska)Ingår i: IEEE International Conference on Data Mining Workshops, ICDMW, IEEE Computer Society, 2017, s. 623-630, artikel-id 7836725Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Word sense disambiguation is a fundamental problem in natural language processing (NLP). In this problem, a large corpus of documents contains mentions to well-known (non-Ambiguous) words, together with mentions to ambiguous ones. The goal is to compute a clustering of the corpus, such that documents that refer to the same meaning appear in the same cluster, subsequentially, each cluster is assigned to a different semantic meaning. In this paper, we propose a mechanism for word sense disambiguation based on distributed graph clustering that is incremental in nature and can scale to big data. A novel, heuristic vertex-centric algorithm based on the metaphor of the water cycle is used to cluster the graph. Our approach is evaluated on real datasets in both centralized and decentralized environments.

Ort, förlag, år, upplaga, sidor
IEEE Computer Society, 2017. s. 623-630, artikel-id 7836725
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Identifikatorer
URN: urn:nbn:se:kth:diva-208441DOI: 10.1109/ICDMW.2016.0094ISI: 000401906900086Scopus ID: 2-s2.0-85015234357ISBN: 9781509054725 (tryckt)OAI: oai:DiVA.org:kth-208441DiVA, id: diva2:1106458
Konferens
16th IEEE International Conference on Data Mining Workshops, ICDMW 2016, Barcelona, Spain, 12 December 2016 through 15 December 2016
Anmärkning

QC 20170607

Tillgänglig från: 2017-06-07 Skapad: 2017-06-07 Senast uppdaterad: 2018-01-13Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Sök vidare i DiVA

Av författaren/redaktören
Rahimian, FatemehGirdzijauskas, Sarunas
Av organisationen
Programvaruteknik och Datorsystem, SCS
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
isbn
urn-nbn

Altmetricpoäng

doi
isbn
urn-nbn
Totalt: 200 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf