kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Predicting thermostable transaminase variants with machine learning methods
KTH, School of Engineering Sciences in Chemistry, Biotechnology and Health (CBH), Industrial Biotechnology.
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Prediktion av termostabila transaminasvarianter med maskininlärningsmetoder (Swedish)
Abstract [sv]

Transaminaser (TAs) är viktiga biokatalysatorer inom hållbar kemisk tillverkning och erbjuder ett miljövänligt sätt att syntetisera kirala aminer, som är mycket eftertraktade inom produktionen av läkemedel och finkemikalier. Deras begränsade termostabilitet begränsar dock ofta deras användning i industriella tillämpningar som kräver högre temperaturer. Denna avhandling undersöker en maskininlärningsmetod för att förbättra termostabiliteten hos TAs, med fokus på transaminaset från Silicibacter pomeroyi (SpATA). En modell baserat på ett neuralt nätverk utvecklades för att förutsäga smälttemperaturen (Tm) hos TAs baserat på deras proteinsekvens, förtränad på ett dataset med olika typer av enzymer och finjusterad på ett dataset av transaminaser. Med hjälp av RFdiffusion och ProteinMPNN genererades flera varianter av SpATA genom att introducera mutationer på mindre konserverade aminosyror. Modellen förutsade Tm-värden för dessa varianter, och fem lovande kandidater valdes ut med förutsagda ökningar av Tm på upp till 18°C jämfört med vildtypen. Även om förtroendet för de absoluta värdena är tveksamt, tyder resultaten på att kandidaterna sannolikt har förbättrad termostabilitet. Trots att experimentell validering inte genomfördes, belyser resultaten potentialen i att använda maskininlärning för att påskynda utvecklingen av termostabila biokatalysatorer.

Abstract [en]

Transaminases (TAs) are key biocatalysts in sustainable chemical manufacturing, offering an environmentally friendly method of synthesizing chiral amines which are in high demand for producing pharmaceuticals and fine chemicals. However, their limited thermostability often restricts their use in industrial applications that require higher temperatures. This thesis explores a machine learning approach to improve the thermostability of TAs, focusing on the transaminase from Silicibacter pomeroyi (SpATA). A neural network model was developed to predict the melting temperature (Tm) of TAs from their sequence, pre-trained on a dataset of diverse enzymes and fine-tuned using a dataset of fold type I TAs. Using RFdiffusion and ProteinMPNN, many SpATA variants were generating by introducing mutations at less conserved residues. The model predicted the Tm values of these variants, and five promising candidates were selected with predicted Tm increases of up to 18°C over the wild-type. While the confidence in the absolute values of the predictions is moderate, the results suggest that the candidates are likely to exhibit improved thermostability. Although experimental validation was not conducted, the findings highlight the potential of utilizing machine learning techniques to accelerate the development of thermostable biocatalysts.

Place, publisher, year, edition, pages
2024.
Series
TRITA-CBH-GRU ; 2024:382
Keywords [en]
Biocatalysis, transaminase, thermostability, machine learning, neural network
Keywords [sv]
Biokatalys, transaminas, termostabilitet, maskininlärning, neuralt nätverk
National Category
Biocatalysis and Enzyme Technology
Identifiers
URN: urn:nbn:se:kth:diva-356612OAI: oai:DiVA.org:kth-356612DiVA, id: diva2:1914641
Subject / course
Biotechnology
Educational program
Master of Science - Medical Biotechnology
Supervisors
Examiners
Available from: 2024-11-20 Created: 2024-11-20

Open Access in DiVA

fulltext(1892 kB)91 downloads
File information
File name FULLTEXT01.pdfFile size 1892 kBChecksum SHA-512
cd8edad21f9ec882cee491891cf51831b8fe915f9c350d1d88071d22f57b2c52e27f164a6b20b97fdfb88c2ad03bf3086233997e2d6d60a79471dac91a4eaf1c
Type fulltextMimetype application/pdf

By organisation
Industrial Biotechnology
Biocatalysis and Enzyme Technology

Search outside of DiVA

GoogleGoogle Scholar
Total: 91 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 519 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf