On Medical Image Segmentation With Noisy Labels
2023 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
It is well known that data sets used for training and testing automatic medical image segmentation methods often contain a lot of label noise. Such noise affects the performance of the methods and has been subject to a lot of research. One way to approach the topic of label noise that largely has been overlooked in the literature is to investigate how it affects the theoretically optimal segmentations. This thesis consist of four papers related to such investigations for the two most popular choices of loss functions in the field, cross-entropy and soft-Dice, and the most popular metric, Dice.
In paper A, the loss functions cross-entropy and soft-Dice are investigated. Inspired by work from binary classification, the properties of calibration and convexity are proposed to explain the experimental observations of good stability associated with cross-entropy and good performance associated with soft-Dice. It is then shown that soft-Dice neither is convex nor quasi-convex and it is conjectured that soft-Dice is calibrated to Dice. Finally, an alternative quasi-convex loss function is experimentally compared to soft-Dice on a kidney segmentation problem.
In paper B, the optimal segmentations to the metrics Accuracy and Dice are characterized when noise is present. This characterization is then used to give a detailed account of the volume bias associated with the metrics. In particular, sharp bounds for volume bias is provided, it is shown that the volume of an optimizer to Accuracy always is less than or equal to the volume of an optimizer to Dice and that the set of optimizers to the two metrics coincide when the optimization is constrained to the segmentations without volume bias. Finally, experimental results supporting the observations are presented on a set of segmentation problems.
In paper C, the effect label noise has on soft-Dice is studied. In particular, the optimal solutions are characterized and sharp bounds for the volume biasis provided. Moreover the conjecture of soft-Dice being calibrated to Dice is proved under a compactness assumption that always holds in practice. Finally, experimental results supporting the observations are presented on a set of organ segmentation problems and a set of synthetic segmentation problems.
In paper D, a noise model based on Gaussian field deformations is proposed. Several theoretical properties for labels with this sort of noise is proved, including a closed form expression for marginal probabilities and a representation that can be used for efficient sampling. The noise model is then used to study 1/2-thresholded optimal solutions to the loss functions cross-entropyand soft-Dice, and it is shown how they diverge as the noise level is increased. Finally, by using the characterization of the optimal solutions to soft-Dice it is shown how cross-entropy can be used in conjunction with an a priori unknown but computable threshold to recover optimal solutions to soft-Dice. The theoretical observations are validated on three organ segmentation problems with various levels of noise.
Abstract [sv]
Det är väl känt att data som används för träning och testning av medicinska bildsegmenteringsmetoder ofta innehåller mycket annoteringsbrus. Sådant brus påverkar prestandan av metoderna och har givit upphov till en stor mängd forskning. Ett sätt att angripa frågan om annoteringsbrus som i stort har förbisetts är att undersöka hur det påverkar vilka segmenteringar som är teoretiskt optimala. Den här avhandlingen består av fyra artiklar relaterade till sådana studier för de två inom fältet mest populära målfunktionerna cross-entropy och soft-Dice, samt den mest populära metriken Dice.
I artikel A studeras målfunktionen cross-entropy och soft-Dice. Det föreslås, inspirerat av arbete inom binärklassifikation, att konvexitet och kalibrering kan användas för att beskriva de experimentella observationerna av bra stabilitet kopplad till cross-entropy och bra prestanda kopplad till soft-Dice. Sedan bevisas det att soft-Dice vare sig är konvex eller kvasi-konvex och så förmodas det att soft-Dice är kalibrerad till Dice. Slutligen introduceras en alternativ kvasi-konvex målfunktion som experimentellt jämförs med soft-Dice på ett njursegmenteringsproblem.
I artikel B karakteriseras de optimala lösningarna till Accuracy och Dice när brus är närvarande. Denna karakteriseringen används sedan för att ge en detaljerad beskrivning av volymbias associerad med metrikerna. Specifikt visas skarpa gränser för volymbias, att Accuracy-optimala segmenteringar alltid har mindre eller lika stor volym som Dice-optimala segmenteringar samt att de optimala lösningarna till metrikerna sammanfaller när optimeringen görs över mängden av segmenteringar utan volymbias. Slutligen presenteras experimentella resultat som bekräftar de teoretiska observationerna på en uppsättning segmenteringsproblem.
I artikel C undersöks effekten brus har på soft-Dice. De optimala lösningarna karakteriseras och skarpa gränser för volymbias presenteras. Vidare bevisas den tidigare förmodan om att soft-Dice är kalibrerad till Dice under ett kompakthetsantagande som alltid håller i praktiken. Slutligen presenteras experimentella resultat som bekräftar de teoretiska observationerna på en uppsättning organsegmenteringsproblem och en uppsättning syntetiska segmenteringsproblem.
I artikel D presenteras en brusmodell baserad på deformationer av Gaussiska fält. Flera teoretiska egenskaper för brusmodellen bevisas, inklusive en sluten form för marginalsannolikheter samt en representation som kan användas för effektiv simulering. Brusmodellen används sedan för att studera 1/2-trösklade optimala lösningar till cross-entropy och soft-Dice, och specifikt, hur dessa divergerar när nivån av brus går upp. Med hjälp av karakteriseringen av de optimala lösningarna till soft-Dice visas det hur optimala lösningar till soft-Dice kan fås med hjälp av cross-entropy och ett annat tröskelvärde som inte är a priori känt men som effektivt kan beräknas. Till sist valideras de teoretiska observationerna på tre organsegmenteringsproblem.
Place, publisher, year, edition, pages
Stockholm, Sweden: KTH Royal Institute of Technology, 2023. , p. 162
Series
TRITA-SCI-FOU ; 2023;11
Keywords [en]
Medical image segmentation, image segmentation, machine learning, supervised learning, label noise, Sörensen-Dice coefficient, soft-Dice
Keywords [sv]
Medicinsk bildsegmentering, bildsegmentering, maskininlärning, övervakat lärande, annoteringsbrus, Sörensen-Dice koefficienten, soft-Dice
National Category
Medical Imaging
Research subject
Applied and Computational Mathematics; Applied and Computational Mathematics, Mathematical Statistics
Identifiers
URN: urn:nbn:se:kth:diva-326552ISBN: 978-91-8040-538-6 (print)OAI: oai:DiVA.org:kth-326552DiVA, id: diva2:1754892
Public defence
2023-06-01, Kollegiesalen, Brinellvägen 6, Stockholm, 13:00 (Swedish)
Opponent
Supervisors
Note
QC 2023-05-10
2023-05-102023-05-042025-02-09Bibliographically approved
List of papers