Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Improving the Quality of Web Content through Automated Metrics: An attempt to process course pages at the kth.se website
KTH, School of Information and Communication Technology (ICT), Communication Systems, CoS, Radio Systems Laboratory (RS Lab). (CCS)
2015 (English)Report (Other (popular science, discussion, etc.))
Abstract [en]

Today many organizations make a great deal of content available via a web interface. For this project the main scope will be the public web of KTH Royal Institute of Technology. KTH has lots of data available online. The problem that occurs is that the people who write this content do not get feedback about what they post. The idea of this project is to change that and by giving the responsible person(s) feedback about their content.

The main goal of the project is keeping track of changes of web pages. For example, each course has its own content and information pages - which can be changed by the person(s) responsible for the course. When pages are available in two languages and changes are made to one of them the logical expectation would be that the other language has to be changed as well. However, in the current system there is no systematic way that this change occurs or that someone would be reminded when only one version changed. Similarly for other content pages, although these might not be in multiple languages it would be interesting to see how often a page is updated and to notify the responsible person(s) that a certain page has not been updated in quite some time.

A secondary goal of this project is to provide a proof of concept implementation of a tool that can automatically access web page in KTH Social (a locally developed web service) – thus enabling users to write code that can access, modify, and annotate web pages. Such a tool could be used to compute readability scores for each page and then annotate the page with this score.

The code that was implemented for this project accomplished both goals. Some suggestions are made for how this process can be improved and how alternatively this processing could be done by working directly on the databases used to produce dynamic content.

Abstract [sv]

I dagens läge lägger många organisationer upp stora mängder material på webben. Detta projekt tittar främst på det offentliga webgränssnittet för KTH.

KTH har stora mängder data tillgängligt online. Ett problem är att användare som redigerar och lägger upp denna data inte får återkoppling på den. Iden bakom detta projekt är att ge dessa användare återkoppling om deras material.

Det slutgiltiga målet i detta projekt är att hålla koll på förändring i websidor. Till exempel kurshemsidorna på KTH som har sin egen information och innehåll och kan ändras av kursansvarige. När websidor är tillgängliga i mer än ett språk och det sker en förändring i ena språkets version förväntar man sig att informationen ska ändras på de andra språken också. I det nuvarande systemet finns det dock inget systematiskt sätt som detta ändras på och den ansvarige blir inte påmind att endast den ena ändrats. Man kan tänka sig något liknande för andra typer av innehåll. Till exempel kan det vara intressant att se hur ofta en sida uppdateras och påminna den ansvarige när en sida inte blivit uppdaterad på ett tag.

Ett sekundärt mål med detta projekt är att visa upp ett verktyg som kan nå websidor på KTH Social och möjliggöra ändrandet av websidor med kod. Ett sådant verktyg kan användas för att beräkna “läsbarhetspoäng” (readability points) för varje websida och sedan kommentera sidan med denna poäng.

Den implementerade koden för detta projekt uppnådde båda dessa mål. Några förslag har formulerats för hur denna process kan förbättras till exempel genom att arbeta direkt i databaserna för att producera dynamiskt material.

Place, publisher, year, edition, pages
Stockholm, Sweden: KTH Royal Institute of Technology, 2015. , xiii,45 p.
Series
TRITA-ICT-EX, 2015:92
Keyword [en]
web crawling, readability
Keyword [sv]
webbsökning, läsbarhet
National Category
Communication Systems
Identifiers
URN: urn:nbn:se:kth:diva-168729OAI: oai:DiVA.org:kth-168729DiVA: diva2:818200
Note

QC 20150615

Available from: 2015-06-08 Created: 2015-06-08 Last updated: 2015-06-15Bibliographically approved

Open Access in DiVA

fulltext(895 kB)68 downloads
File information
File name FULLTEXT01.pdfFile size 895 kBChecksum SHA-512
453c167602ac492d322d96f0b18877d4d3b9ec194ad6cfc32b409f69b0c136ed1387365d78694b4c86597a14713a3f04668062a3286971293c11b73d471276a1
Type fulltextMimetype application/pdf
software(96 kB)0 downloads
File information
File name SOFTWARE01.zipFile size 96 kBChecksum SHA-512
881ff9f8c277163d8edfe21bce5194dcbb3ba0552372c3050aac231452d652540f008be0ff87f3127ec658b212b6d1b56da7c1cdc24094cb2d40ad86e628cf4e
Type softwareMimetype application/zip

Search in DiVA

By author/editor
Baetens, Jens
By organisation
Radio Systems Laboratory (RS Lab)
Communication Systems

Search outside of DiVA

GoogleGoogle Scholar
Total: 68 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 204 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf