kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Går det att avgöra bitrate i en video med hjälp av klassificerande maskininlärning?
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

This study investigates the potential of using image-classifying machine learning to determine the bitrate of video content, a metric pivotal for assessing video quality in streaming applications. With the rapid disappearance of physical media over the past fifteen years, streaming has necessitated efficient video compression techniques to minimize data transmission while maintaining quality. Bitrate, which measures data transfer rate per second, plays a crucial role in this context, as higher bitrates typically correspond to higher video quality. The core of this research revolves around the deployment of Convolutional Neural Networks (CNNs), which are adept at feature learning and classification based on image and video analysis. These models process video by extracting significant features such as edges, textures, and shapes, followed by classification to predict video quality metrics like bitrate. The methodology included extracting frames from compressed videos, structuring the data according to bitrate categories, and utilizing Keras, a TensorFlow API, for model training and evaluation. Models were tested across different configurations to optimize learning parameters and assess performance based on precision and loss metrics. Initial results indicated a challenge in reliably distinguishing between videos of different bitrates, suggesting tendencies of both underfitting and overfitting in various model configurations. The study identified critical factors influencing model performance, including the amount of training data and the inherent complexity of the video content. In conclusion, while the models demonstrated some capacity to associate bitrate with video quality, the results were inconclusive, highlighting the need for larger, more diverse datasets and potentially more sophisticated model architectures to improve accuracy and reliability in bitrate classification using machine learning. The findings underscore the complexity of video data compression and the challenges in using AI to predict quality metrics solely based on bitrate.

Abstract [sv]

Denna studie undersöker potentialen att använda bildklassificering med maskininlärning för att bestämma bitrate i videoklipp. Med det snabba försvinnandet av fysiska medier under de senaste femton åren har strömning krävt effektiva videokomprimeringstekniker för att minimera datatransmission utan att förstöra tittarupplevelsen. Bitrate, ett mått för att mäta dataöverföringshastighet per sekund, spelar en avgörande roll i detta sammanhang, eftersom högre bithastigheter vanligtvis motsvarar högre videokvalitet. Denna studie bygger på användningen av konvolutionella neurala nätverk (CNN), som är skickliga på att lära sig funktioner och klassificering baserat på bild- och videoanalys. Dessa modeller bearbetar video genom att extrahera betydande funktioner som kanter, texturer och former, följt av klassificering för att förutsäga videokvalitetsmetriker som bitrate. Metodiken inkluderade extraktion av bildrutor från komprimerade videor, strukturering av data enligt bitrate-kategorier och användning av Keras, en TensorFlow API, för modellträning och utvärdering. Modellerna testades med olika konfigurationer för att optimera inlärningsparametrar och bedöma prestanda baserat på precision och förlustmetriker. Inledande resultat indikerade en utmaning med att tillförlitligt skilja mellan videor med olika bithastigheter, vilket tyder på tendenser till både underanpassning och överanpassning i olika modellkonfigurationer. Studien identifierade kritiska faktorer som påverkar modellprestanda, inklusive mängden träningsdata och den inneboende komplexiteten hos videomaterialet. Sammanfattningsvis visade modellerna viss kapacitet att associera bithastigheten med videokvaliteten, men resultaten var inte entydiga, vilket understryker behovet av större, mer varierade dataset och potentiellt mer sofistikerade modellarkitekturer för att förbättra noggrannheten och tillförlitligheten vid klassificering av bithastighet med hjälp av maskininlärning. Resultaten betonar komplexiteten hos videodatakomprimering och utmaningarna med att använda AI för att förutsäga kvalitetsmetriker enbart baserat på bithastighet.

Place, publisher, year, edition, pages
2024. , p. 9
Series
TRITA-EECS-EX ; 2024:541
Keywords [en]
Video, Bitrate, Convolutional Neural Network, Artificial Intelligence, Python, TensorFlow, Keras
Keywords [sv]
Video, Bitrate, Konvolutionella Neurala Nätverk, Artificiell Intelligens, Python, TensorFlow, Keras
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-352624OAI: oai:DiVA.org:kth-352624DiVA, id: diva2:1894801
Supervisors
Examiners
Available from: 2024-10-01 Created: 2024-09-04 Last updated: 2024-10-01Bibliographically approved

Open Access in DiVA

fulltext(713 kB)35 downloads
File information
File name FULLTEXT01.pdfFile size 713 kBChecksum SHA-512
cb4f51a2a2726ed7cc499d713f8e99a30d6c88d9204b40c780f27ac8c2889f61d1304f84281a71dd38ec7d86f3fd4e041734e13894936417c8a7ec86508f3c80
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 35 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 124 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf