Skin cancer is a common disease and malignant melanoma is the most dangerous form of it. Although dangerous, the survival rate of melanoma patients is high if the diagnosis is made at an early stage. Computer aided diagnostics has been shown to have potential in accurately diagnosing the disease utilizing machine learning. Thus, machine learning algorithms can be used to effectively classify a skin lesions as either benign or malignant. These algorithms can be made more accurate and efficient by applying feature selection since it decreases the dimensionality of the feature space. The aim of this study is to apply feature selection on four different classifiers to compare morphological and SIFT features in order to determine which features are important for classifying melanoma. The results show that morphological features in general had a higher importance than the SIFT features, although this varied between different classifiers. Furthermore, forward selection was more effective than backward selection in terms of accuracy for three out of the four classifiers. Lastly, two morphological features were significantly more important than the other features. The most effective feature measured the compactness of the lesion and the second most described the contrast between the lesion and the surrounding skin in terms of the color red.
Hudcancer är en vanlig sjukdom och malignt melanom är den farligaste formen av hudcancer. Trots att formen är farlig så är sannolikheten att en patient kan botas från sjukdomen hög om diagnosen sker i ett tidigt stadium. Datordriven diagnostisering har visat sig kunna effektivt diagnostisera sjukdomen med hög säkerhet genom att tillämpa maskininlärning. På så vis kan maskininlärningsalgoritmer användas för att klassificera hudutslag som godartade eller inte. Dessa algoritmer kan effektiviseras genom att utföra attributurvalsmetoder då det minskar antalet dimensioner som behöver beräknas. Syftet med denna studie är att undersöka vilka attribut som är viktiga för klassificeringen. Detta gjordes genom att tillämpa attributurvalsmetoderna Sekventiell Framåt- och Bakåtselektion på fyra olika maskininlärningsalgoritmer med indata i form av morfologiska och SIFT-attribut. Resultaten visar att morfologiska attribut generellt föredrogs i större utsträckning än SIFT-attribut, detta varierade dock mellan olika klassificeringsmodeller. Vidare var Framåtselektion mer effektiv än Bakåtselektion sett till träffsäkerhet för tre av klassificeringsmodellerna. Slutligen var två attribut mer effektiva än de andra. Det mest effektiva attributet beskrev utslagens kompakthet och den andra beskrev kontrasten mellan utslagen och huden runtomkring med avseende på den röda färgen.