Går det att avgöra bitrate i en video med hjälp av klassificerande maskininlärning?
2024 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesis
Abstract [en]
This study investigates the potential of using image-classifying machine learning to determine the bitrate of video content, a metric pivotal for assessing video quality in streaming applications. With the rapid disappearance of physical media over the past fifteen years, streaming has necessitated efficient video compression techniques to minimize data transmission while maintaining quality. Bitrate, which measures data transfer rate per second, plays a crucial role in this context, as higher bitrates typically correspond to higher video quality. The core of this research revolves around the deployment of Convolutional Neural Networks (CNNs), which are adept at feature learning and classification based on image and video analysis. These models process video by extracting significant features such as edges, textures, and shapes, followed by classification to predict video quality metrics like bitrate. The methodology included extracting frames from compressed videos, structuring the data according to bitrate categories, and utilizing Keras, a TensorFlow API, for model training and evaluation. Models were tested across different configurations to optimize learning parameters and assess performance based on precision and loss metrics. Initial results indicated a challenge in reliably distinguishing between videos of different bitrates, suggesting tendencies of both underfitting and overfitting in various model configurations. The study identified critical factors influencing model performance, including the amount of training data and the inherent complexity of the video content. In conclusion, while the models demonstrated some capacity to associate bitrate with video quality, the results were inconclusive, highlighting the need for larger, more diverse datasets and potentially more sophisticated model architectures to improve accuracy and reliability in bitrate classification using machine learning. The findings underscore the complexity of video data compression and the challenges in using AI to predict quality metrics solely based on bitrate.
Abstract [sv]
Denna studie undersöker potentialen att använda bildklassificering med maskininlärning för att bestämma bitrate i videoklipp. Med det snabba försvinnandet av fysiska medier under de senaste femton åren har strömning krävt effektiva videokomprimeringstekniker för att minimera datatransmission utan att förstöra tittarupplevelsen. Bitrate, ett mått för att mäta dataöverföringshastighet per sekund, spelar en avgörande roll i detta sammanhang, eftersom högre bithastigheter vanligtvis motsvarar högre videokvalitet. Denna studie bygger på användningen av konvolutionella neurala nätverk (CNN), som är skickliga på att lära sig funktioner och klassificering baserat på bild- och videoanalys. Dessa modeller bearbetar video genom att extrahera betydande funktioner som kanter, texturer och former, följt av klassificering för att förutsäga videokvalitetsmetriker som bitrate. Metodiken inkluderade extraktion av bildrutor från komprimerade videor, strukturering av data enligt bitrate-kategorier och användning av Keras, en TensorFlow API, för modellträning och utvärdering. Modellerna testades med olika konfigurationer för att optimera inlärningsparametrar och bedöma prestanda baserat på precision och förlustmetriker. Inledande resultat indikerade en utmaning med att tillförlitligt skilja mellan videor med olika bithastigheter, vilket tyder på tendenser till både underanpassning och överanpassning i olika modellkonfigurationer. Studien identifierade kritiska faktorer som påverkar modellprestanda, inklusive mängden träningsdata och den inneboende komplexiteten hos videomaterialet. Sammanfattningsvis visade modellerna viss kapacitet att associera bithastigheten med videokvaliteten, men resultaten var inte entydiga, vilket understryker behovet av större, mer varierade dataset och potentiellt mer sofistikerade modellarkitekturer för att förbättra noggrannheten och tillförlitligheten vid klassificering av bithastighet med hjälp av maskininlärning. Resultaten betonar komplexiteten hos videodatakomprimering och utmaningarna med att använda AI för att förutsäga kvalitetsmetriker enbart baserat på bithastighet.
Place, publisher, year, edition, pages
2024. , p. 9
Series
TRITA-EECS-EX ; 2024:541
Keywords [en]
Video, Bitrate, Convolutional Neural Network, Artificial Intelligence, Python, TensorFlow, Keras
Keywords [sv]
Video, Bitrate, Konvolutionella Neurala Nätverk, Artificiell Intelligens, Python, TensorFlow, Keras
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-352624OAI: oai:DiVA.org:kth-352624DiVA, id: diva2:1894801
Supervisors
Examiners
2024-10-012024-09-042024-10-01Bibliographically approved