To avoid discrimination between the genders and to improve the performance of machine learning, it is important to evaluate how different test data can impact how accurate machine learning models can be. This study investigates if the distribution between women and men in the training data affects how accurately different machine learning models can classify emotions used in the speaker’s tone of voice. The data used in the study is the RAVDESS dataset, where a part of the data was used for the training and the rest was used for testing the accuracy of the machine learning models. When analyzing the results, it was found that when comparing the results of using 75 % female and 25 % male, 25 % female and 75 % male or equal parts male and female training data, the highest accuracy of the majority of the models was when using equal parts male and female test data. Comparing the result of using 75 % female and 25 % male versus 25 % female and 75 % male, the accuracy was slightly higher when using a majority of the data being male. However, the difference was so small that no conclusion could be drawn more than that using equal parts training data from both genders is preferable.
För att undvika diskriminering mellan könen och för att förbättra prestandan för maskininlärning är det viktigt att utvärdera hur olika testdata kan påverka exaktheten hos maskininlärningsmodeller. Den här studien undersöker huruvida fördelningen mellan kvinnor och män i träningsdatan påverkar hur korrekt olika maskininlärningsmodeller kan klassificera känslor som används i talarens tonfall. Data som används i studien är datasetet RAVDESS, där en del av datan användes för att träning av maskininlärningsmodellerna och resten användes för att testa maskininlärningsmodellernas korrekhet. När resultaten mellan att använda 75 % kvinnor och 25 % män, 25 % kvinnor och 75 % män eller lika delar manliga och kvinnliga träningsdata analyserades fann man att den högsta noggrannheten för majoriteten av modellerna var med lika delar manliga och kvinnliga testdata. Jämför man resultatet av att använda 75 % kvinnor och 25 % män mot 25 % kvinnor och 75 % män, var korrektheten något högre när man använde en majoritet av manliga data. Skillnaden var dock så liten att ingen slutsats kunde dras mer än att användning av lika delar träningsdata från båda könen är att föredra.