Designing Convolutional Neural Networks for Classification of Metastatic Tissue in the Lymph Nodes: Evaluation of the Effect of Feature Map Distributions Across Convolutional Layers on Network Performance
2022 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesis
Abstract [en]
Cancer is one of the leading causes of mortality in the world. It is estimated that about 20% of males and 17% of females will suffer it at some point in their lives, while 13% of males and 9% of females will die from it [1]. Cancer is caused by abnormal cell growth which can spread through the body in a process called metastasis. One of the ways to diagnose and evaluate the severity of cancer is to analyse the lymph nodes for presence of metastatic tissue. Recently, Artificial Neural Networks (ANNs) have been used to aid the detection of such tissue in images, but there are many design decisions to consider in making a network for this task. One of the most important design decisions when developing an ANN is the choice of the network, as this will define how the model will evaluate patterns from the input. Convolutional Neural Networks are the main ANN architecture used for image analysis, as these use filters to evaluate how prevalent different shapes or patterns are in an image. My research has studied how different ways of using these filters affects lymph node image classification results. From the worst to best performing models tested, there is a 0.0739 accuracy gap (from 0.8494 to 0.9234), representing an 8.709% increase in performance. Within models of the same size in terms of number of patterns analysed, there are gaps of up to 0.035 accuracy. My research has found network size to be closely related to training time, although different designs have different training complexities, so a case can be made for models of a same size that perform worse but also train faster. The main conclusion of this project is that the way features are extracted from lymph node images in a Neural Network clearly affect its performance, but also its training complexity. With this knowledge, one can test different approaches and designs according to their requirements and resources.
Abstract [sv]
Cancer är en av de främsta dödsorsakerna i världen. Man uppskattar att cirka 20% av männen och 17% av kvinnorna kommer att drabbas någon gång under sitt liv, medan 13% av männen och 9% av kvinnorna kommer att dö av cancer [1]. Cancer orsakas av onormal celltillväxt som kan spridas i kroppen i en process som kallas metastasering. Ett av sätten att diagnostisera och bedöma cancerens svårighetsgrad är att analysera lymfkörtlarna för att se om det finns metastaserande vävnad. På senare tid har artificiella neurala nätverk (ANN) använts för att underlätta upptäckten av sådan vävnad i bilder, men det finns många konstruktionsbeslut att ta hänsyn till när man gör ett nätverk för denna uppgift. Ett av de viktigaste besluten när man utvecklar ett ANN är valet av nätverk, eftersom detta kommer att definiera hur modellen kommer att utvärdera mönster från inmatningen. Konvolutionella neurala nätverk är den vanligaste ANN-arkitekturen som används för bildanalys, eftersom dessa använder filter för att utvärdera hur vanligt förekommande olika former eller mönster är i en bild. I min forskning har jag studerat hur olika sätt att använda dessa filter påverkar resultaten av klassificeringen av lymfkörtelbilder. Från de sämsta till de bäst presterande modellerna som testats finns det en skillnad i noggrannhet på 0,0739 (från 0,8494 till 0,9234), vilket motsvarar en ökning av prestanda med 8,709 %. Inom modeller av samma storlek när det gäller antalet analyserade mönster finns det skillnader på upp till 0,035 noggrannhet. Min forskning har visat att nätverksstorlek är nära relaterad till träningstid, även om olika konstruktioner har olika träningskomplexitet, så det går att argumentera för att modeller av samma storlek presterar sämre men också tränas snabbare. Den viktigaste slutsatsen av det här projektet är att det sätt på vilket funktionerna extraheras från bilder av lymfkörtlar i ett neuralt nätverk tydligt påverkar dess prestanda, men också dess träningskomplexitet. Med denna kunskap kan man testa olika tillvägagångssätt och konstruktioner utifrån sina krav och resurser.
Place, publisher, year, edition, pages
2022. , p. 27
Series
TRITA-EECS-EX ; 2022:497
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-320015OAI: oai:DiVA.org:kth-320015DiVA, id: diva2:1703302
Subject / course
Computer Science
Educational program
Master of Science in Engineering - Computer Science and Technology
Supervisors
Examiners
2022-10-132022-10-122022-10-13Bibliographically approved