Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Kan man lära datorer att läsa?
KTH, School of Computer Science and Communication (CSC).
2011 (Swedish)Independent thesis Advanced level (professional degree), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

An evaluation on different sorts of cluster analysis have been performed. To do this evaluation an interesting problem-set will be used, character recognition. This is interesting because cluster analysis is a method built on unsupervised learning. What distinguish unsupervised learning from other methods is that it have no knowledge about what class a object belong to when evaluating. This is an important diffrence from other character recognition techniques, where they often learn by looking at what features a specific character has.

The cluster algorithms evaluated are K-means, Xmeans and Hierarchical clustering, and for these methods the following distance measures have been used Euclidian distance, Cosine similarity and Manhattan distance.

The objective of this evaluation is to find out if its possible to use cluster analysis to do character recognition and to evaluate the conditions needed to do this succesfully.

The main conclusion is that it indeed is possible to use cluster analysis to perform character recognition, if you have the possibility to affect the parameters used. In this evaluation it has been found that parameters that map more directly to the picture representation of the characters have performed better. To determine more exact what a good parameter is a more extensive analysis is needed.

Author: Niklas Lundborg

Abstract [sv]

En undersökning av olika typer av klustringsalgoritmer har genomförts. Undersökningen behandlar en intressant probleminstans, teckenigenkänning. Det som är intressant med att använda klustring för teckenigenkänning är att klustring är en metod som bygger på oövervakad inlärning och det som utmärker oövervakade inlärningsmetoder är att sådana metoder ej känner till vilken klass ett objekt tillhör i upplärningsfasen. Detta skiljer sig markant från vanliga teckenigenkänningsmetoder, där man ofta tränar genom att titta vilka egenskaper som finns för varje klass av objekt.

De klustringsalgoritmer som undersökts är K-means, Xmeans, hiearkisk klustring och till dessa har olika avståndsberäkningar använts , Euklidskt avstånd, Cosinusmått och Manhattan avstånd.

Syftet med undersökningen är att ta reda på om det går att använda klustringsalgoritmer för att utföra teckenigenkänning och undersöka vilka förutsättningar som behövs för att lyckas.

Slutsatsen är att det går att använda klustring i detta syfte, om man har möjlighet att påverka vilka parametrar som används. I denna undersökning så har teckenparametrar som är mer direkt relaterade till hur bilden på tecknet ser ut visat sig fungera bra. För att mer nogrannt avgöra vad som utmärker en bra parameter behövs en mer omfattande undersökning.

Författare: Niklas Lundborg

Place, publisher, year, edition, pages
2011.
Series
Kandidatexjobb CSC, K11060
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-130846OAI: oai:DiVA.org:kth-130846DiVA: diva2:654293
Educational program
Master of Science in Engineering - Computer Science and Technology
Uppsok
Technology
Supervisors
Examiners
Available from: 2013-10-07 Created: 2013-10-07

Open Access in DiVA

No full text

Other links

http://www.csc.kth.se/utbildning/kandidatexjobb/datateknik/2011/rapport/lundborg_niklas_K11060.pdf
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 88 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf