Open this publication in new window or tab >>2022 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
Efficient representations of observed input data have been shown to significantly accelerate the performance of subsequent learning tasks in numerous domains. To obtain such representations automatically, we need to design both i) models that identify useful patterns in the input data and encode them into structured low dimensional representations, and ii) evaluation measures that accurately assess the quality of the resulting representations. In this thesis, we present work that addresses both these requirements, where we extensively focus on requirement ii) since the evaluation of representations has been largely unexplored in the machine learning research. We begin with an overview of representation learning techniques and different structures that can be imposed on representation spaces, thus first addressing i). In this regard,we present a representation learning model that identifies useful patterns from multimodal data, and describe an approach that promotes a structure on there presentation space that is favourable for performing a robotics task. We then thoroughly study the problem of assessing the quality of learned representations and overview the pitfalls of current practices. With this, we motivate the evaluation based on analyzing geometric properties of representations and present two novel evaluation algorithms constituting the core of this thesis. Finally, we present an application of the proposed evaluation algorithms to compare large input graphs.
Abstract [sv]
Effektive representationer av observerat input-data har visat sig ge ensignifikant ökning av prestandan för träningsproblem i ett flertal områden.För att på ett automatiskt sett få fram sådana representationer behövervi både i) modeller som kan identifiera användbara mönster i input-datatoch koda dessa till strukturerade lågdimensionella representationer, samtii) utvärderingsmått som på ett tillförlitligt sätt mäter kvaliteten av dessarepresentationer. I denna avhandling presenterar vi arbete som hanterar bådadessa krav, där fokus ligger på ii) eftersom utvärdering av representationerhar varit ett i stort sätt outforskat ämne i litteraturen för maskininlärning.Vi börjar med en översikt av representationsinlärningstekniker och typer avstrukturer som man kan förelägga på representationsrymden, vilket tillhöri). I detta avseende, presenterar vi modell för representationsinlärning somidentifierar användbara mönster från multimodal data, samt beskriver enmetod som framhäver struktur på representationsrymden som gör sig välpassande för robotikuppgift. Vi studerar sedan genomgående problemet medatt avgöra kvaliteten av dessa inlärda representationer och ger en översikt avvanliga fallgropar som finns med nuvarande metoder. Vi motiverar med dettautvärderingen baserat på av representationernas geometriska egenskaper ochpresenterar två nya utvärderingsalgoritmer vilka huvuddelen av avhandlingenbestår av. Slutligen så presenterar vi ett praktiskt användningsområde avalgoritmerna för att jämföra stora inputgrafer.
Place, publisher, year, edition, pages
KTH Royal Institute of Technology, 2022. p. 54
Series
TRITA-EECS-AVL ; 2022:33
Keywords
Representation Learning, Machine Learning, Generative Models
National Category
Computer Sciences
Research subject
Computer Science
Identifiers
urn:nbn:se:kth:diva-312723 (URN)978-91-8040-228-6 (ISBN)
Public defence
2022-06-13, https://kth-se.zoom.us/j/65953366981, F3, Lindstedtsvägen 26, Stockholm, 15:00 (English)
Opponent
Supervisors
Note
QC 20220523
2022-05-232022-05-202022-06-25Bibliographically approved