Comparative Performance of Binary vs. Multi-to-Binary Gastrointestinal Image Classification: Using YOLOv8 on Video Capsule Endoscopy Images of Crohn’s Disease Patients
2024 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesisAlternative title
Jämförelse av Binär- och Multi-till-Binär Klassificering av Gastrointestinala Bilder med YOLOv8 på Videokapselendoskopier från Patienter med Crohns Sjukdom (Swedish)
Abstract [en]
Crohn’s disease is a chronic inflammatory bowel condition that can lead to severe symptoms and complications within the gastrointestinal tract. In Europe alone, approximately 1 in 310 people are diagnosed with Crohn’s disease. A common diagnostic tool for this condition is capsule endoscopy, which captures around 50,000 images of the gastrointestinal tract to identify pathological lesions. Computer-aided diagnosis is already being explored for early detection of cancers, cardiovascular diseases, and other conditions. In this study, we investigate the capability of the YOLOv8 convolutional neural network to perform binary image classification on an endoscopic image dataset with a class imbalance problem. Our findings demonstrate that a multi-class trained YOLOv8 model that uses oversampling as a class imbalance solution can effectively differentiate between normal and pathological states, achieving 93.4% accuracy.
Abstract [sv]
Crohns sjukdom är en kronisk inflammatorisk tarmsjukdom som kan medföra allvarliga symtom och komplikationer inom mag-tarmkanalen. Enbart i Europa är ungefär 1 av 310 personer drabbade av Crohns sjukdom. Ett vanligt verktyg för att diagnostisera Crohn’s sjukdom är kapselendoskopi, ett ingrepp där runt 50 000 bilder av mag-tarmkanalen tas för att identifiera patologiska förändringar. Datorstödd diagnostik utforskas redan för tidig upptäckt av cancer, hjärt-kärlsjukdomar och andra tillstånd. I denna studie undersöker vi kapaciteten hos YOLOv8-konvolutionella neurala nätverk att utföra binär bildklassificering på en endoskopisk bilddatabas med ett problem med klassobalans. Våra resultat visar att en YOLOv8-modell, tränad för flera klasser och med översampling som lösning på klassobalansen, effektivt kan skilja mellan normala och patologiska tillstånd, med en noggrannhet på 93,4%.
Place, publisher, year, edition, pages
2024. , p. 33
Series
TRITA-EECS-EX ; 2024:376
Keywords [en]
Convolutional neural networks, YOLOv8, Crohn’s disease, image classification, class imbalance
Keywords [sv]
Konvolutionella neurala nätverk, YOLOv8, Crohns sjukdom, bildklassificering, klassobalans
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-351168OAI: oai:DiVA.org:kth-351168DiVA, id: diva2:1886394
Supervisors
Examiners
2024-08-232024-08-012024-08-23Bibliographically approved