Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Folket har makten över ordet – Ett ordboksredigeringssystem för allmänheten.
KTH, School of Computer Science and Communication (CSC).
2011 (Swedish)Independent thesis Advanced level (professional degree), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Developing a dictionary is an expensive and time consuming task. Its also a never ending process as natural languages are always evolving. In this thesis we present a system that lets anonymous Internet users edit a bilingual dictionary, The Peoples Dictionary. The dictionary will be made available for download to use freely.

The system is meant to be automatic and is completely lacking any dedicated editors. To keep the quality of the dictionary high, we instead let the end users survey each other.

When a contribution arrives to the system it is split into smaller parts. Each part is presented as a question in a poll, that decides whether the change should be carried out or be discarded. For the voting procedure to be valid, a user shouldnt be allowed to vote more than one time on the same question. This risk is minimized by having a large set of questions and picking new questions at random from this set.

We also make an effort to automatically filter out bad contributions, especially those that may potentially be offensive.

Abstract [sv]

Att ta fram ett lexikon är en dyr och tidskrävande process. Det är också en process som aldrig tar slut eftersom naturliga språk hela tiden utvecklas. I denna rapport presenteras ett system som låter anonyma Internetanvändare redigera ett tvåspråkigt lexikon, Folkets lexikon. Lexikonet kommer sedan att kunna laddas ner för fri användning. Detta system är ämnat att vara självgående och saknar helt dedikerade granskare. För att hålla kvalitén på lexikonet hög, låter vi istället slutanvändarna bli granskare av lexikonet.

När en ändring inkommer till systemet så delas den upp i mindre delar. Varje del presenteras sedan som en fråga i en omröstning som avgör ifall ändringen ska genomföras eller förkastas. För att omröstningarna ska vara giltiga så bör en användare inte kunna rösta mer än en gång på samma fråga. Risken för detta hålls nere genom att omröstningar slumpas fram ifrån en stor mängd frågor.

Vidare gör vi en ansträngning för att automatiskt plocka bort dåliga förslag och i synnerhet potentiellt stötande sådana.

Place, publisher, year, edition, pages
2011.
Series
Trita-CSC-E, ISSN 1653-5715 ; 2011:071
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-130737OAI: oai:DiVA.org:kth-130737DiVA: diva2:654184
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.nada.kth.se/utbildning/grukth/exjobb/rapportlistor/2011/rapporter11/lilja_patrik_11071.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 40 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf