Deep Learning Models for Detecting Breast Cancer: A Comparative Study
2023 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesisAlternative title
En jämförelse av två djupinlärningsmodeller för identifiering av bröstcancer (Swedish)
Abstract [en]
Breast cancer is the second leading cause of death for women worldwide. As early detection is vital, new methods for facilitating accurate diagnosis are continuously being developed. This project investigates Deep Learning algorithms for detecting breast cancer, specifically two Convolutional Neural Networks (CNNs), comparing their accuracy in correctly classifying lesions in mammograms as benign or malignant. The models used in this project were Breast Cancer Classifier (BCC) and the Globally-aware Multiple Instance Classifier (GMIC). The degree of which the accuracy differs for different levels of breast density, a measurement describing the nature of the tissue of the breast, was also studied. In order to compare the models, they were tested on the same dataset of mammograms. Performance was evaluated by visualising data, and using statistic methods such as confusion matrices and clustering. Both models achieved high accuracy (accuracy BCC = 0.875 and accuracy GMIC = 0.903), but some questions were raised by the results, as higher benign predictions were over-represented. Some possible reasons for the over-predicting of benignancy were discussed, such as class imbalance in the testing dataset. As GMIC did not predict any malignancy, the implications of both false positive and false negative diagnoses were considered when evaluating the models. This led to discarding the GMIC as the best model for correctly identifying lesions in mammograms, despite having the highest accuracy score. The analysis of the results from a breast density perspective did not reveal any significant correlation between breast density and accuracy. Future research could, for example, explore transfer learning to allow for less specific image pre-processing methodology, and curating well-balanced datasets for both training and testing purposes.
Abstract [sv]
Bröstcancer är den näst vanligaste dödsorsaken bland kvinnor världen över. Då en tidig upptäckt av cancern är avgörande för en effektiv behandling, utvecklas konstant nya verktyg för att förenkla och förbättra diagnostiseringen av nya patienter. I det här projektet undersöks två djupinlärningsalgoritmer som är utvecklade i detta syfte. Modellernas tillförlitlighet jämfördes genom att undersöka deras förmåga att korrekt identifiera god-och elakartade tumörer på mammogram. Modellerna som används i detta projekt var Breast Cancer Classifier (BCC) och Globally-aware Multiple Instance Classifier (GMIC) som båda är exempel på konvolutionella neurala nätverk (CNNs). Det undersöktes även huruvida tillförlitligheterna påverkades av bröstdensitet, ett mått som beskriver hur bröstvävnaden ser ut. För att testa modellerna användes ett oberoende dataset som ingen av modellerna var tränad på. Resultatet utvärderades genom visulisering av datan, genom statiska metoder såsom confusion matrices och klustring. Båda modellerna uppnådde en hög tillförlitlighet på 0.875 för BCC och 0.903 för GMIC. Dessa resultat ifrågasattes dock i och med en överrepresentation av godartardade lesioner. Några möjliga orsaker såsom klassimbalans i datasetet diskuterades. Då GMIC-modellen inte klassifierade någon bild som elakartad, diskuterades även implikationerna av både falska negativa och falska positiva bedömningar. Detta ledde till att GMIC inte ansågs som den främsta modellen i avseendet att korrekt identifiera bröstcancer i mammogram, trots att den hade den högsta tillförlitlighetsvärdet. Analysen av resultatet från ett bröstdensitetsperspektiv visade ingen tydlig korrelation mellan bröstdensitet och tillförlitligheten. Framtida forskning skulle till exempel kunna utforska möjligheterna med transfer learning, vilket skulle kunna tillåta mindre specifik förbehandling av bilderna. Även användningen av välbalanserade dataset, både för modellers träning och testning, skulle kunna undersökas.
Place, publisher, year, edition, pages
2023. , p. 38
Series
TRITA-EECS-EX ; 2023:287
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-330772OAI: oai:DiVA.org:kth-330772DiVA, id: diva2:1778373
Supervisors
Examiners
2023-07-272023-07-012023-07-27Bibliographically approved