Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Feature selection for machine learning: Evaluation of univariate and multivariate filter methods for different classifiers
KTH, School of Electrical Engineering and Computer Science (EECS).
2018 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

This thesis is a comparative study between ten different filter methods, which arecombined with four different classifiers. Each of the unique combinations of filter methodand classifier is evaluated on 30 datasets from different problem domains. The results ofthe study show that there is no interaction effect between the filter methods and theclassifiers. In addition, the results show that univariate filter methods are in general fasterthan multivariate filter methods whereas the subsequent classification performances arecomparable. Therefore, it is difficult to motivate the extra computational time andresources that multivariate filter methods require. The following two questions wereraised during the study: when is it even relevant to perform feature selection (how muchredundancy and/or irrelevance should be present among the features?) and how does onedetermine the desired number of features that the reduced feature subset should have?To answer these questions is suggested for future research

Abstract [sv]

Den här uppsatsen är en komparativ studie mellan tio olika filtermetoder som kombineras med fyra olika klassificeringsalgoritmer. Varje unik kombination av filtermetod och klassificeringsalgoritm utvärderas på 30 olika dataset från olika problemdomäner. Studiens resultat visar att det inte finns någon interaktionseffekt mellan de studerade filtermetoderna och klassificeringsalgoritmerna. Dessutom visar resultaten att univariata filtermetoder i allmänhet är snabbare än multivariata filtermetoder samtidigt som klassificeringsprestationen hos klassificeringsalgoritmerna som kombineras med de olika grupperna av filtermetoder är jämförbara. Det är därför svårt att motivera den extra beräkningstiden och beräkningskapaciteten som de multivariata filtermetoderna kräver. Två frågor som uppstod under studiens gång är: när är det ens relevant att tillämpa filtermetoder för att filtrera bort attribut (hur mycket redundans och/eller irrelevans bör finnas bland attributen?) och hur bestämmer man antalet attribut som man vill att filtermetoderna ska välja? Att besvara dessa frågor är föreslaget för framtida studier

Place, publisher, year, edition, pages
2018.
Series
TRITA-EECS-EX ; 2018:761
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-253785OAI: oai:DiVA.org:kth-253785DiVA, id: diva2:1325985
Supervisors
Examiners
Available from: 2019-06-17 Created: 2019-06-17 Last updated: 2019-06-17Bibliographically approved

Open Access in DiVA

No full text in DiVA

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar

urn-nbn

Altmetric score

urn-nbn
Total: 16 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf