Variational Bayesian Inference for Reconciliation of Gene Trees and Species Trees
2024 (engelsk)Independent thesis Advanced level (degree of Master (Two Years)), 20 poäng / 30 hp
Oppgave
Abstract [en]
Gene tree-species tree reconciliation is the problem of mapping each node in a gene tree to a position in a species tree. Several methods have been used to address this problem. Variational inference is a method for finding the best approximation to the true distribution in a family of distributions. In this project, we investigated whether variational inference is a useful method to address the gene tree-species tree reconciliation problem. The distribution of trees is modeled by a so-called Subsplit Bayesian Network (SBN), and the evolution process is modeled by a birth-death process with constant duplication- and loss rate. We implemented the method in Python and compared it with A Variational Approach to Bayesian Phylogenetic Inference [1] (VBPI) [1] using synthetic data. The result showed that our method outperformed VBPI in most test cases.
Abstract [sv]
Genträd-artträdsförsoning är problemet med att kartlägga varje nod i ett genträd till en position i ett artträd. Flera metoder har använts för att lösa detta problem. Variationsinferens är en metod för att hitta den bästa approximationen till den sanna fördelningen i en familj av sannolikhetsfördelningar. I det här projektet undersökte vi om variationsinferens är en användbar metod för att lösa Genträd-artträdsförsoningproblemet. Fördelningen av träd modelleras av ett så kallat subsplit Bayesian-nätverk (SBN), och evolutionsprocessen är modellerad av en födelse-dödsprocess med konstant duplicering- och förlusthastighet. Vi implementerade metoden i Python och jämförde den med VBPI [1] med syntetisk data. Resultatet visade att vår metod överträffade VBPI i de flesta testfallen.
sted, utgiver, år, opplag, sider
2024. , s. 47
Serie
TRITA-EECS-EX ; 2024:78
Emneord [en]
Bayesian, phylogenetic inference, variational inference, subsplit Bayesian networks, gene tree, species tree, gene duplication and loss, reconciliation
Emneord [sv]
Bayesiansk, fylogenetisk inferens, variationsinferens, subsplit Bayesianska nätverk, genträd, artträd, genduplikation och förlust, försoning
HSV kategori
Identifikatorer
URN: urn:nbn:se:kth:diva-347936OAI: oai:DiVA.org:kth-347936DiVA, id: diva2:1871793
Fag / kurs
Computer Science
Utdanningsprogram
Master of Science - Computer Science
Veileder
Examiner
2024-06-202024-06-172024-06-20bibliografisk kontrollert