kth.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Variational Bayesian Inference for Reconciliation of Gene Trees and Species Trees
KTH, Skolan för elektroteknik och datavetenskap (EECS).
2024 (Engelska)Självständigt arbete på avancerad nivå (masterexamen), 20 poäng / 30 hpStudentuppsats (Examensarbete)
Abstract [en]

Gene tree-species tree reconciliation is the problem of mapping each node in a gene tree to a position in a species tree. Several methods have been used to address this problem. Variational inference is a method for finding the best approximation to the true distribution in a family of distributions. In this project, we investigated whether variational inference is a useful method to address the gene tree-species tree reconciliation problem. The distribution of trees is modeled by a so-called Subsplit Bayesian Network (SBN), and the evolution process is modeled by a birth-death process with constant duplication- and loss rate. We implemented the method in Python and compared it with A Variational Approach to Bayesian Phylogenetic Inference [1] (VBPI) [1] using synthetic data. The result showed that our method outperformed VBPI in most test cases.

Abstract [sv]

Genträd-artträdsförsoning är problemet med att kartlägga varje nod i ett genträd till en position i ett artträd. Flera metoder har använts för att lösa detta problem. Variationsinferens är en metod för att hitta den bästa approximationen till den sanna fördelningen i en familj av sannolikhetsfördelningar. I det här projektet undersökte vi om variationsinferens är en användbar metod för att lösa Genträd-artträdsförsoningproblemet. Fördelningen av träd modelleras av ett så kallat subsplit Bayesian-nätverk (SBN), och evolutionsprocessen är modellerad av en födelse-dödsprocess med konstant duplicering- och förlusthastighet. Vi implementerade metoden i Python och jämförde den med VBPI [1] med syntetisk data. Resultatet visade att vår metod överträffade VBPI i de flesta testfallen.

Ort, förlag, år, upplaga, sidor
2024. , s. 47
Serie
TRITA-EECS-EX ; 2024:78
Nyckelord [en]
Bayesian, phylogenetic inference, variational inference, subsplit Bayesian networks, gene tree, species tree, gene duplication and loss, reconciliation
Nyckelord [sv]
Bayesiansk, fylogenetisk inferens, variationsinferens, subsplit Bayesianska nätverk, genträd, artträd, genduplikation och förlust, försoning
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-347936OAI: oai:DiVA.org:kth-347936DiVA, id: diva2:1871793
Ämne / kurs
Datalogi
Utbildningsprogram
Teknologie masterexamen - Datalogi
Handledare
Examinatorer
Tillgänglig från: 2024-06-20 Skapad: 2024-06-17 Senast uppdaterad: 2024-06-20Bibliografiskt granskad

Open Access i DiVA

fulltext(565 kB)144 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 565 kBChecksumma SHA-512
90753838ce0a22444482ff99efcd61d7df8fb46480d2725d755c8c98124c28acd58877820ac73347e6b07137abeb7986613cd1bcf566fc9a0747a1f91866f5d6
Typ fulltextMimetyp application/pdf

Av organisationen
Skolan för elektroteknik och datavetenskap (EECS)
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 144 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 294 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf