Morphing architectures for pose-based image generation of people in clothing
2018 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hp
Studentuppsats (Examensarbete)Alternativ titel
Morphing-arkitekturer för pose-baserad bildgeneration av människor i kläder (Svenska)
Abstract [en]
This project investigates the task of conditional image generation from misaligned sources, with an example application in the context of content creation for the fashion industry.
The problem of spatial misalignment between images is identified, the related literature is discussed, and different approaches are introduced to address it. In particular, several non-linear differentiable morphing modules are designed and integrated in current architectures for image-to-image translation.
The proposed method for conditional image generation is applied on a clothes swapping task, using a real-world dataset of fashion images provided by Zalando. In comparison to previous methods for clothes swapping and virtual try-on, the result achieved with our method are of high visual quality and achieve precise reconstruction of the details of the garments.
Abstract [sv]
Detta projekt undersöker villkorad bildgenerering från förskjutna bild-källor, med ett tillämpat exempel inom innehållsskapande för modebranschen.
Problemet med rumslig förskjutning mellan bilder identifieras varpå relaterad litteratur diskuteras. Därefter introduceras olika tillvägagångssätt för att lösa problemet. Projektet fokuserar i synnerhet på ickelinjära, differentierbara morphing-moduler vilka designas och integreras i befintlig arkitektur för bild-till-bild-översättning.
Den föreslagna metoden för villkorlig bildgenerering tillämpas på en uppgift för klädbyte, med hjälp av ett verklighetsbaserat dataset av modebilder från Zalando. I jämförelse med tidigare modeller för klädbyte och virtuell provning har resultaten från vår metod hög visuell kvalité och uppnår exakt återuppbyggnad av klädernas detaljer.
Ort, förlag, år, upplaga, sidor
2018.
Serie
TRITA-EECS-EX ; 2018:501
Nyckelord [en]
Deep learning, image generation, fashion
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-233361OAI: oai:DiVA.org:kth-233361DiVA, id: diva2:1239446
Externt samarbete
Zalando Research (Berlin)
Utbildningsprogram
Teknologie masterexamen - Maskininlärning
Presentation
2018-06-28, Room 523, Teknikringen 14, Stockholm, 11:15 (Engelska)
Handledare
Examinatorer
2018-08-312018-08-162018-08-31Bibliografiskt granskad