Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Morphing architectures for pose-based image generation of people in clothing
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2018 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)Alternativ titel
Morphing-arkitekturer för pose-baserad bildgeneration av människor i kläder (Svenska)
Abstract [en]

This project investigates the task of conditional image generation from misaligned sources, with an example application in the context of content creation for the fashion industry.

The problem of spatial misalignment between images is identified, the related literature is discussed, and different approaches are introduced to address it. In particular, several non-linear differentiable morphing modules are designed and integrated in current architectures for image-to-image translation.

The proposed method for conditional image generation is applied on a clothes swapping task, using a real-world dataset of fashion images provided by Zalando. In comparison to previous methods for clothes swapping and virtual try-on, the result achieved with our method are of high visual quality and achieve precise reconstruction of the details of the garments.

Abstract [sv]

Detta projekt undersöker villkorad bildgenerering från förskjutna bild-källor, med ett tillämpat exempel inom innehållsskapande för modebranschen.

Problemet med rumslig förskjutning mellan bilder identifieras varpå relaterad litteratur diskuteras. Därefter introduceras olika tillvägagångssätt för att lösa problemet. Projektet fokuserar i synnerhet på ickelinjära, differentierbara morphing-moduler vilka designas och integreras i befintlig arkitektur för bild-till-bild-översättning.

Den föreslagna metoden för villkorlig bildgenerering tillämpas på en uppgift för klädbyte, med hjälp av ett verklighetsbaserat dataset av modebilder från Zalando. I jämförelse med tidigare modeller för klädbyte och virtuell provning har resultaten från vår metod hög visuell kvalité och uppnår exakt återuppbyggnad av klädernas detaljer.

Ort, förlag, år, upplaga, sidor
2018.
Serie
TRITA-EECS-EX ; 2018:501
Nyckelord [en]
Deep learning, image generation, fashion
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-233361OAI: oai:DiVA.org:kth-233361DiVA, id: diva2:1239446
Externt samarbete
Zalando Research (Berlin)
Utbildningsprogram
Teknologie masterexamen - Maskininlärning
Presentation
2018-06-28, Room 523, Teknikringen 14, Stockholm, 11:15 (Engelska)
Handledare
Examinatorer
Tillgänglig från: 2018-08-31 Skapad: 2018-08-16 Senast uppdaterad: 2018-08-31Bibliografiskt granskad

Open Access i DiVA

fulltext(13957 kB)307 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 13957 kBChecksumma SHA-512
484eb65c543cf9ed0957fe4937b69c00ba18484587dae4f1473c21c024b734fb9923c48f09f95e37a2c5b6edfcb7da8f75a2be6e1df76f41d49613823ee5a0d1
Typ fulltextMimetyp application/pdf

Sök vidare i DiVA

Av författaren/redaktören
Baldassarre, Federico
Av organisationen
Skolan för elektroteknik och datavetenskap (EECS)
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 307 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 142 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf