Open this publication in new window or tab >>2024 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
Spatial biology is a rapidly growing field that has seen tremendous progress over the last decade. We are now able to measure how the morphology, genome, transcriptome, and proteome of a tissue vary across space. Datasets generated by spatial technologies reflect the complexity of the systems they measure: They are multi-modal, high-dimensional, and layer an intricate web of dependencies between biological compartments at different length scales. To add to this complexity, measurements are often sparse and noisy, obfuscating the underlying biological signal and making the data difficult to interpret. In this thesis, we describe how data from spatial biology experiments can be analyzed with methods from deep learning and generative modeling to accelerate biological discovery. The thesis is divided into two parts. The first part provides an introduction to the fields of deep learning and spatial biology, and how the two can be combined to model spatial biology data. The second part consists of four papers describing methods that we have developed for this purpose. Paper I presents a method for inferring spatial gene expression from hematoxylin and eosin stains. The proposed method offers a data-driven approach to analyzing histopathology images without relying on expert annotations and could be a valuable tool for cancer screening and diagnosis in the clinics. Paper II introduces a method for jointly modeling spatial gene expression with histology images. We show that the method can predict super-resolved gene expression and transcriptionally characterize small-scale anatomical structures. Paper III proposes a method for learning flexible Markov kernels to model continuous and discrete data distributions. We demonstrate the method on various image synthesis tasks, including unconditional image generation and inpainting. Paper IV leverages the techniques introduced in Paper III to integrate data from different spatial biology experiments. The proposed method can be used for data imputation, super resolution, and cross-modality data transfer.
Abstract [sv]
Spatial biologi är ett snabbt växande forskningsområde som har sett en hög utvecklingstakt under det senaste decenniet. Vi kan idag mäta hur en vävnads morfologi, genom, transkriptom och proteom varierar i rummet. Dataset skapade av spatiala teknologier återspeglar komplexiteten i de system de mäter: De är multimodala, högdimensionella och är uppbyggda av ett intrikat nätverk av beroenden mellan biologiska strukturer som existerar på olika längdskalor. Som om denna komplexitet inte var nog, är mätningarna ofta både glesa och brusiga, vilket försvårar tolkningen av den underliggande biologiska signalen. I denna avhandling beskriver vi hur data från experiment inom spatial biologi kan analyseras med hjälp av djupinlärning och generativ modellering för att accelerera biologiska upptäckter. Avhandlingen är uppdelad i två delar. Den första delen ger en introduktion till fälten djupinlärning och spatial biologi, och hur dessa kan kombineras för att modellera data inom spatial biologi. Den andra delen består av fyra artiklar som beskriver metoder som vi har utvecklat för detta ändamål. Artikel I presenterar en metod för att skatta spatialt genuttryck från hematoxylin-eosin-färgningar. Den föreslagna metoden erbjuder ett datadrivet tillvägagångssätt för att analysera histopatologi-bilder utan användning av expertannoteringar och kan utgöra ett värdefullt verktyg för cancerscreening och diagnos i kliniken. Artikel II introducerar en metod för sammodellering av spatialt genuttryck och histologibilder. Vi visar att metoden kan användas för att predicera superupplöst genuttryck och transkriptionellt karakterisera småskaliga anatomiska strukturer. Artikel III beskriver en metod för modellering av kontinuerliga och diskreta datafördelningar med flexibla Markovkärnor. Vi demonstrerar metoden på olika bildgenereringsuppgifter, inklusive obetingad datagenerering och inpainting. Artikel IV utnyttjar teknikerna från Artikel III för att integrera data från olika experiment inom spatial biologi. Den föreslagna metoden kan användas för imputering, superupplösning och dataöverföring mellan olika modaliteter.
Place, publisher, year, edition, pages
KTH Royal Institute of Technology, 2024. p. 66
Series
TRITA-CBH-FOU ; 2024:1
National Category
Bioinformatics (Computational Biology)
Research subject
Biotechnology
Identifiers
urn:nbn:se:kth:diva-341968 (URN)978-91-8040-820-2 (ISBN)
Public defence
2024-01-31, Air & Fire, Tomtebodavägen 23A, via Zoom: https://kth-se.zoom.us/j/68950542171, Solna, 10:00 (English)
Opponent
Supervisors
Note
QC 2024-01-09
2024-01-092024-01-082024-01-30Bibliographically approved