COVID-19 had enormous impact on society and in a world where digitalization is more prevalent than ever, we have access to great amounts of computing power and algorithms. Lempel-Ziv complexity is an algorithm of particular interest that measures the complexity of a string, and has already been applied on multiple problems of biological nature. In this thesis we have evaluated whether or not the Lempel-Ziv complexity of the virus SARS-CoV-2 has changed since 2019. To execute this, two programming solutions have been implemented. The first to select randomized data from GISAID and the second to execute the algorithm on 1,000 FASTA-formatted files at a time. We showed that the complexity had generally decreased since 2019. This, however, may have been the results of evolving sequencing methods as large spreads in data could be observed for the Delta and Omicron variants.
Covid-19 har haft en enorm påverkan på samhället och i en värld där digitalisering är mer etablerat än någonsin har vi tillgång till stora mängder datorkraft och algoritmer. Lempel-Ziv-komplexitet är en algoritm av särskilt intresse som mäter en strängs komplexitet och har redan tillämpats på flera problem inom biologi. I denna avhandling har vi utvärderat huruvida Lempel-Ziv-komplexiteten för viruset SARS-CoV-2 har förändrats sedan 2019. För att utföra detta projekt har två programmeringslösningar implementerats. Den första för att välja slumpmässig data från GISAID och den andra för att exekvera algoritmen på 1 000 FASTA-formaterade filer åt gången. Vi visade att komplexiteten generellt sett hade minskat sedan 2019. Detta kan dock ha varit resultatet av förändrade sekvenseringsmetoder eftersom stora spridningar i data kunde observeras för Delta- och Omicron-varianterna.