kth.sePublications KTH
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
A Comparative Analysis of Object Detection Models in the Electronic Sports Domain
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2025 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
En jämförande analys av objektdetekteringsmodeller inom elektronisk sport (Swedish)
Abstract [en]

Electronic sports, or esports, is a rapidly growing and influential industry in which individuals or teams compete in video games. A critical aspect of esports is data collection and analysis, which plays a key role in understanding player performance, developing strategy, and improving the spectator experience. However, for many games, such as Counter-Strike 2 and League of Legends, detailed in-game data is only available through official livestreams, and not through APIs or other external sources. To address this limitation, object detection, the task of identifying and classifying instances of objects in images, can be used to extract relevant information directly from on-screen overlays in live-streamed match footage. This thesis provides insight into the practical applications of modern object detection frameworks. Three models from distinct paradigms in object detection are compared in terms of average precision and inference time. The models are fine-tuned on synthetic datasets and tested on manually annotated datasets. Our results show that RT-DETRv2 is applicable to varying datasets that mainly consist of small objects. YOLOX yields great inference times, but often at the cost of average precision. As expected, Faster R-CNN shows the poorest trade-off between average precision and inference time and highlights some of its limitations such as the reliance on anchors. Our research offers guidance on selecting appropriate models for real-time applications. Quick and accurate visual detection not only improves decision-making in autonomous driving, thereby enhancing road safety, but also facilitates faster and more precise diagnoses in medical imaging, directly supporting UN SDG 3: Good health and well-being by saving lives.

Abstract [sv]

Elektronisk sporter, eller e-sport, är en snabbt växande och inflytelserik industri där individer eller lag tävlar i datorspel. En kritisk aspekt av e-sport är insamling och analys av data, som spelar en nyckelroll i att förstå spelarprestationer, utveckla strategier och förbättra tittarupplevelsen. För många spel, såsom Counter-Strike 2 och League of Legends, är detaljerad speldata endast tillgänglig via officiella livesändningar och inte genom API:er eller andra externa källor. För att hantera denna begränsning kan objektdetektering, identifiering och klassificering av objekt i bilder, användas för att extrahera relevant information direkt från livesända matchvideor. Detta kandidatexamensarbete ger insikt i de praktiska tillämpningarna av moderna ramverk för objektdetektering. Tre modeller från olika paradigm inom objektdetektering jämförs utifrån genomsnittlig precision och inferenstid. Modellerna tränas på syntetiska dataset och testas på manuellt annoterade dataset. Våra resultat visar att RT-DETRv2 kan appliceras på varierande dataset som till största delen består av små objekt. YOLOX ger mycket snabba inferenstider, men ofta på bekostnad av precision. Som förväntat uppvisar Faster R-CNN den sämsta avvägningen mellan precision och inferenstid, vilket belyser vissa av dess begränsningar såsom beroendet av ankarpunkter. Vår forskning ger vägledning i val av lämpliga modeller för realtidstillämpningar. Snabb och träffsäker visuell detektion förbättrar inte bara beslutsfattande inom autonom körning och därmed ökar trafiksäkerheten, utan möjliggör även snabbare och mer precisa diagnoser inom medicinsk bildanalys, vilket direkt stödjer FN:s globala mål 3: God hälsa och välbefinnande genom att rädda liv.

Place, publisher, year, edition, pages
2025. , p. 47
Series
TRITA-EECS-EX ; 2025:331
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-367670OAI: oai:DiVA.org:kth-367670DiVA, id: diva2:1985750
External cooperation
Abios Gaming AB
Supervisors
Examiners
Available from: 2025-08-05 Created: 2025-07-27 Last updated: 2025-08-05Bibliographically approved

Open Access in DiVA

fulltext(1533 kB)243 downloads
File information
File name FULLTEXT01.pdfFile size 1533 kBChecksum SHA-512
c06077c10a3c6062bf3b6f1833ba884bcd938d942a88302ba5de8a87804a4465b3bd0c6d43468fa452d65397742e2359699246cb980bf009062545245fae9953
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 244 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 726 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf