Variational Bayesian Inference for Reconciliation of Gene Trees and Species Trees
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesis
Abstract [en]
Gene tree-species tree reconciliation is the problem of mapping each node in a gene tree to a position in a species tree. Several methods have been used to address this problem. Variational inference is a method for finding the best approximation to the true distribution in a family of distributions. In this project, we investigated whether variational inference is a useful method to address the gene tree-species tree reconciliation problem. The distribution of trees is modeled by a so-called Subsplit Bayesian Network (SBN), and the evolution process is modeled by a birth-death process with constant duplication- and loss rate. We implemented the method in Python and compared it with A Variational Approach to Bayesian Phylogenetic Inference [1] (VBPI) [1] using synthetic data. The result showed that our method outperformed VBPI in most test cases.
Abstract [sv]
Genträd-artträdsförsoning är problemet med att kartlägga varje nod i ett genträd till en position i ett artträd. Flera metoder har använts för att lösa detta problem. Variationsinferens är en metod för att hitta den bästa approximationen till den sanna fördelningen i en familj av sannolikhetsfördelningar. I det här projektet undersökte vi om variationsinferens är en användbar metod för att lösa Genträd-artträdsförsoningproblemet. Fördelningen av träd modelleras av ett så kallat subsplit Bayesian-nätverk (SBN), och evolutionsprocessen är modellerad av en födelse-dödsprocess med konstant duplicering- och förlusthastighet. Vi implementerade metoden i Python och jämförde den med VBPI [1] med syntetisk data. Resultatet visade att vår metod överträffade VBPI i de flesta testfallen.
Place, publisher, year, edition, pages
2024. , p. 47
Series
TRITA-EECS-EX ; 2024:78
Keywords [en]
Bayesian, phylogenetic inference, variational inference, subsplit Bayesian networks, gene tree, species tree, gene duplication and loss, reconciliation
Keywords [sv]
Bayesiansk, fylogenetisk inferens, variationsinferens, subsplit Bayesianska nätverk, genträd, artträd, genduplikation och förlust, försoning
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:kth:diva-347936OAI: oai:DiVA.org:kth-347936DiVA, id: diva2:1871793
Subject / course
Computer Science
Educational program
Master of Science - Computer Science
Supervisors
Examiners
2024-06-202024-06-172024-06-20Bibliographically approved