Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Innehåll och yta i läsbarhetsanalys
KTH, School of Computer Science and Communication (CSC).
2014 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
Abstract [sv]

En läsbarhetsalgoritm utvärderar en text och ger den ett numeriskt värde som anses återspegla hur lättläst textenär. Syftet med denna kandidatexamensuppsats är att utifrån en diskussion om läsbarhetsbegreppet och läsbarhetsalgoritmen LIX (läsbarhetsindex) ta fram alternativa läsbarhetsalgoritmer,för att därefter utvärdera om dessa kan bedöma läsbarhet bättre än LIX. Utvärderingen sker med hjälp av texter ur två grupper,för varje text i den ena gruppen finns en motsvarande text i den andra med ett liknande innehåll och komplexitet men med en språkmässig skillnad. Materialet som kategoriserats som mer lättläst består av texter som belönats medden så kallade Klarspråkskristallen som årligen delas ut till statliga organ, exempelvis Riksbanken, som gjort framstående insatser för att göra sina publikationer mer lättlästa.Gruppen med texter som kategoriserats som mer svårlästa består av motsvarande publikationer ifrån dessa organ från åren innan de tilldelats Klarspråkskristallen.Resultatet av vårt arbete visade att alla algoritmer i testet kunde bedöma vilken av texterna som var mer lättläst i majoriteten av fallen. I ett teckenrangtest med signifikansnivån 5 % gick det dock inte att förkasta hypotesenatt algoritmerna inte kunde avgöra skillnaden mellan texterfrån de två grupperna. En unigramsalgoritm kunde visa ett resultat närmast den önskade statistisk signifikansen, då den på en åttaprocentig signifikansnivå kunde bedöma vilken av texterna som var mest lättläst.

Abstract [en]

A readability algorithm evaluates a text and gives it a numerical value to reflect the it’s readability. This paper discusses the readability algorithm LIX and the concept of readability. It also proposes some alternative readability algorithms and evaluates whether these algorithms can assess readability better than LIX. The evaluation was conducted with texts from two distinct categories. Every text in the first category has a corresponding text in the second one with a similar content but written in a way deemed as less readable. The materialcategorized as more readable consists of texts awarded with ”Klarspråkskristallen”, an annual award to governmentbodies, such as Riksbanken, which has made outstanding efforts to enhance the readability of their publications.The texts classified as less readable consists of corresponding publications from these bodies, published before they were given this award.The results of our study showed that all the algorithms for the majority of the texts could determine which text was more readable. However, in a signed-rank test at a 5 % significance level we could not reject the theory that the algorithms were not able to determine which text was more readable. A unigram algorithm showed results closest to the desired statistical significance, since it was ableto determine which of the texts was most readable at a significance level of 8 %.

Place, publisher, year, edition, pages
2014.
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-157553OAI: oai:DiVA.org:kth-157553DiVA: diva2:770714
Examiners
Available from: 2014-12-12 Created: 2014-12-11 Last updated: 2014-12-12Bibliographically approved

Open Access in DiVA

fulltext(414 kB)160 downloads
File information
File name FULLTEXT01.pdfFile size 414 kBChecksum SHA-512
c446e584077b36259acf0847de12490c31f36fd45ac6b403e5fb8e1f235506c37904273b92dbbfd303dc777c709075305c20434de60308146415c3cb360f9af0
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 160 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 302 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf