Open this publication in new window or tab >>2025 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
Understanding the genetic basis of diseases and individual responses to external stimuli holds immense potential for improving quality of life. Since the discovery of DNA as the carrier of genetic information, science has progressively unraveled the mechanisms of information transfer from DNA to RNA and proteins, bringing us closer to comprehending the principles of human biology. The advent of whole-genome sequencing, genome-wide association studies, and expression quantitative trait loci analysis has made the clinical and, in particular, personalized application of genomic data increasingly feasible. However, it soon became clear that highly penetrant protein-coding mutations, which are relatively straightforward to annotate, account for only ~5% of known cases, typically associated with Mendelian disorders. Most diseases are complex traits involving multiple, often regulatory, non-coding variants.
A significant challenge in annotating non-coding variants lies in two interrelated tasks: (a) predicting the regulatory activity of genomic regions, where variants are located, and (b) linking these regulatory regions to their target genes. This thesis employs sequence capture Hi-C as its primary methodological approach to address both points in a cell-type-specific manner.
In Article A, we investigated whether regulatory variants could predict chemotherapy-induced myelosuppression levels in non-small cell lung cancer patients. To this end, we analyzed interactome and bulk transcriptomic changes following carboplatin or gemcitabine treatments using three relevant hematopoietic cell lines (CMK, MOLM-1, and K-562). As a result, we demonstrated that non-coding variants, previously prioritized in 96 patients with varying degrees of myelosuppression, are enriched in interactions withgenes that exhibit differential interaction profiles upon treatment. This proof- of-concept study laid the foundation for follow-up analyses in patient-derived bone marrow samples.
In Article B, we examined the contribution of rare non-coding variants to the missing heritability of a congenital cardiovascular disorder – bicuspid aortic valve. We combined the endothelial interactome of ascending aorta samples from sixteen adult patients, focusing on all promoter-interacting regions, with individuals’ whole-genome sequencing data. Moreover, we integrated embryonic single-cell and spatial transcriptomic datasets to contextualize these findings developmentally. By leveraging innovative analytical approaches, including allele-specific expression, advanced non-redundant transcription factor motif sets, and single-patient network models, we showed that rare regulatory variants complement protein-coding mutations in shaping the fetal heart mesenchyme and fibroblast transcriptome profiles in disease patients. This work is the foundation for an expanded and more comprehensive ongoingstudy using aortic valve cells.
In Article C, we sought to elucidate the regulatory mechanisms underlying the 9p21 locus, the most significant genetic risk locus for coronary artery disease. We integrated the second part of the endothelial cell interactome dataset, focusing on the coronary artery disease-associated SNPs, with smooth muscle cell interactomes derived from the ascending aortas of six additional patients. We proved that the risk variant rs1333042 interacts with the previously unrelated MIR31HG gene, specifically in endothelial cells. Multiple layers of experimental validation supported this finding.
In conclusion, this thesis advances the field of clinical interactomics by illustrating novel cases of enhanceropathies and proposing new frameworks for integrating interactome data with bulk, single-cell, spatial transcriptomics, and whole-genome sequencing across different developmental stages. These studies offer conceptual insights and practical methodologies for understanding the non-coding genome in disease.
Abstract [sv]
Att förstå den genetiska grunden för sjukdomar och individuella svar på yttre stimuli har en enorm potential för att förbättra livskvaliteten. Sedan upptäckten av DNA som bärare av genetisk information har vetenskapen successivt avslöjat mekanismerna för informationsöverföring från DNA till RNA och proteiner, vilket har fört oss närmare en djupare förståelse av den mänskliga biologins principer. Framväxten av helgenomsekvensering, genomomfattande associationsstudier (GWAS) och analyser av expression quantitative trait loci (eQTL) har gjort det allt mer möjligt att kliniskt och i synnerhet individanpassat tillämpa genomisk data. Det blev dock snart tydligt att mutationer med hög penetrans i proteinkodande regioner, som är relativt enkla att annotera, endast står för cirka 5 % av kända fall, och då oftast i samband med Mendelska sjukdomar. De flesta sjukdomar är komplexa egenskaper som involverar flera, ofta reglerande, icke-kodande varianter.
En stor utmaning vid annotering av icke-kodande varianter ligger i två sammankopplade uppgifter: (a) att förutsäga den regulatoriska aktiviteten i de genomiska regioner där varianterna är belägna, och (b) att koppla dessa regulatoriska regioner till deras mål-gener. Denna avhandling använder sequence capture Hi-C som den huvudsakliga metodologiska ansatsen för att adressera båda dessa punkter på ett celltypsspecifikt sätt.
I Artikel A undersökte vi huruvida regulatoriska varianter kunde förutsäga nivåer av kemoterapiinducerad myelosuppression hos patienter med icke- småcellig lungcancer. För detta ändamål analyserade vi interaktom- och bulktranskriptomförändringar efter behandling med karboplatin eller gemcitabin i tre relevanta hematopoetiska cellinjer (CMK, MOLM-1 och K-562).Som resultat visade vi att icke-kodande varianter, tidigare prioriterade i 96 patienter med varierande grad av myelosuppression, är berikade i interaktioner med gener som uppvisar förändrade interaktionsprofiler efter behandling. Denna proof-of-concept-studie lade grunden för uppföljande analyser i patienthärledda benmärgsprover.
I Artikel B undersökte vi bidraget från sällsynta icke-kodande varianter till den saknade ärftligheten vid en medfödd hjärt-kärlsjukdom – bikuspid aortaklaff. Vi kombinerade endotelinteraktomet från den uppåtstigande aortan hos sexton vuxna patienter, med fokus på alla promotorinteragerande regioner, med individernas helgenomsekvensdata. Dessutom integrerade vi embryonala enkelcells- och spatiala transkriptomdata för att sätta dessa fynd i ett utvecklingssammanhang. Genom att använda innovativa analytiska metoder, inklusive allelspecifik genuttrycksanalys, avancerade icke-redundanta transkriptionsfaktormotiv och nätverksmodeller på individnivå, visade vi att sällsynta regulatoriska varianter kompletterar protein-kodande mutationer i att forma transkriptomprofiler i hjärtmesenkym och fibroblaster hos sjuka foster. Detta arbete utgör grunden för en utvidgad och mer omfattande pågående studie i aortaklaffceller.
I Artikel C syftade vi till att belysa de regulatoriska mekanismerna bakom 9p21-lokuset, det mest signifikanta genetiska risklokuset för kranskärlssjukdom. Vi integrerade den andra delen av endotelcellernas interaktomdataset, med fokus på SNP:er associerade med kranskärlssjukdom, med glattmuskelcellers interaktom från den uppåtstigande aortan hos ytterligare sex patienter. Vi visade att riskvarianten rs1333042 interagerar med den tidigare icke-relaterade genen MIR31HG, specifikt i endotelceller. Flera experimentella valideringslager stödde detta fynd.
Sammanfattningsvis bidrar denna avhandling till området klinisk interaktomik genom att illustrera nya fall av så kallade "enhanceropatier" och föreslå nya ramverk för att integrera interaktomdata med bulk-, enkelcells- och spatial transkriptomik samt helgenomsekvensering över olika utvecklingsstadier. Dessa studier erbjuder konceptuella insikter och praktiska metoder för att förstå den icke-kodande genomens roll i sjukdom.
Place, publisher, year, edition, pages
Stockholm: KTH Royal Institute of Technology, 2025. p. 40
Series
TRITA-CBH-FOU ; 2025:19
Keywords
3D Genome Organization, Enhanceropathies, Gene Regulation, Multiomics, Sequence Capture HiC, 3D-genomorganisation, enhanceropatier, genreglering, multiomik, sequence capture Hi-C
National Category
Medical Epigenetics and Epigenomics Medical Genetics and Genomics
Research subject
Biotechnology
Identifiers
urn:nbn:se:kth:diva-363500 (URN)978-91-8106-320-2 (ISBN)
Public defence
2025-06-13, Air&Fire, SciLifeLab, Tomtebodavägen 23B, 171 65, via Zoom: https://kth-se.zoom.us/j/62604203096?pwd=CajuBXJhNO6vp8G35IOXKYgDJXBYpP.1, Solna, 10:00 (English)
Opponent
Supervisors
Note
QC 20250519
2025-05-192025-05-162025-12-17Bibliographically approved