The thesis aimed to investigate the effects of unintended bias in artificial intelligence has on society and if it was possible to improve the performance of Auto-Speech- Recognition models by training them on non-native Swedish speakers. Two Automatic Speech Recognition systems, Microsoft Azure and Google cloud speech-to-text, were used in the process. Re-trained models were created in order to improve their recognition ability. The models were later evaluated by comparing the word error rates for the re-trained models and the pre-trained models. The study found that re-training the model on non-native speakers improved the performance of the Auto-Speech-Recognition models. This study can be of interest for researches concerning data set bias and how it affects the artificial intelligence models performance. It also helps the reader to understand how auto-speech-recognition models and their basic structure works.
Studiens syfte var att undersöka vilka effekter bias inom artificiell intelligens har på samhället och om det är möjligt att förbättra prestandan av taligenkännings modeller genom att träna dem på talare med svenska som andraspråk. Två taligenkännings system, Microsoft Azure och Google cloud speech-to-text, användes i utförandet av studien. Egna modeller skapades för att förbättra igenkänningen. Modellerna evaluerades sedan genom att jämföra word error rates för de omtränade modellerna och de förtränade modellerna. Modellerna som omtränades på personer med svenska som andraspråk visade en förbättrad igenkänning än de förtränade modellerna. Den här studien kan vara av intresse för studier som undersöker dataset bias och hur det påverkar prestandan av de artificiella intelligens modellerna. Studien kan även hjälpa läsaren att förstå hur taligenkännings modeller och deras struktur fungerar.