Open this publication in new window or tab >>2023 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
The goal of many sciences is to find causal relationships and understand underlying mechanisms. As the golden standard for finding causal relationships, doing randomized experiments can be difficult or impossible in some applications; hence, determining underlying causal relationships purely from observational data, i.e., causal discovery, has attracted more and more attention in many domains, such as earth science, biology, and healthcare. On the one hand, computational methods of causal discovery have been developed and improved significantly in the recent three decades. On the other hand, there are still many challenges in both practice and theory to further achieve real-world impacts. This thesis aims to introduce the typical methods and challenges of causal discovery and then elaborates on the contributions of the included papers that step forward to achieve more real-world impacts for causal discovery. It mainly covers four challenges: practical issues, understanding and generalizing the restrictive assumptions, the lack of benchmark data sets, and applications of causality in machine learning topics. Each included paper contributes to one of the challenges.
In the first paper, regarding causal discovery in the presence of missing data as one of the practical issues, we theoretically study the influence of missing values on causal discovery methods and then correct the errors in their results. Under mild assumptions, our proposed method provides asymptotically correct results.
In the second paper, we investigate the understanding of assumptions in a class of causal discovery methods. Such methods impose substantial constraints on functional classes and distributions of causal processes for determining causal relationships; however, the constraints are restrictive and there is a lack of good understanding. Therefore, we introduce a new dynamical-system view for understanding the methods and their constraints by connecting optimal transport and causal discovery. Furthermore, we provide a causal discovery criterion and a robust optimal transport-based algorithm.
In the third paper, the evaluation of causal discovery methods is discussed. While it is too simplistic to evaluate causal discovery methods on synthetic data generated from random causal graphs, the real-world benchmark data sets with ground-truth causal relations are in great demand and always include practical issues. Thus, we create a neuropathic pain diagnosis simulator based on real-world patient records and domain knowledge. The simulator provides ground-truth causal relations and generates simulation data that cannot be distinguished by the medical expert.
Finally, we explored an application of causality: Fairness in machine learning. Many fairness works are based on the constraints of static statistical measures across different demographic groups. It turns out that decisions under such constraints can lead to a pernicious long-term impact on the disadvantaged group. Therefore, we consider the underlying causal processes, theoretically analyze the equilibrium states of dynamical systems under various fairness constraints, show their impact on equilibrium states, and introduce potentially effective interventions to improve the equilibrium states.
Abstract [sv]
Målet för många vetenskapsområden är att hitta orsakssamband och förstå bakomliggande mekanismer. Som den gyllene standarden för att hitta orsakssamband kan slumpmässiga experiment vara svåra eller omöjliga i vissa tillämpningar; Därför har bestämning av underliggande orsakssamband enbart från observationsdata, d.v.s. kausal upptäckt, väckt mer och mer uppmärksamhet inom många områden, såsom geovetenskap, biologi och sjukvård. Å ena sidan har beräkningsmetoder för kausal upptäckt utvecklats och förbättrats avsevärt under de senaste tre decennierna. Å andra sidan finns det fortfarande många utmaningar kvar i både praktik och teori för att ytterligare uppnå verkliga effekter. Denna avhandling syftar till att introducera de typiska metoderna och utmaningarna för kausal upptäckt och sedan utveckla bidragen från de inkluderade artiklarna som tar kliv framåt för att uppnå fler verkliga effekter för kausal upptäckt. Den täcker huvudsakligen fyra utmaningar: praktiska frågor, förståelse och generalisering av de restriktiva antagandena, bristen på uppsättningar av referensdata och tillämpningar av kausalitet i maskininlärningsområden. Varje medföljande artikel bidrar till en av utmaningarna.
I den första artikeln, angående kausal upptäckt i närvaro av saknade data som en av de praktiska frågorna, studerar vi teoretiskt saknade värdens inverkan på metoder för kausal upptäckt och korrigerar sedan felen i deras resultat. Under milda antaganden ger vår föreslagna metod korrekta resultat.
I den andra artikeln undersöker vi förståelsen av antaganden i en klass av kausala upptäcktsmetoder. Sådana metoder lägger betydande begränsningar på funktionella klasser och fördelningar av kausala processer för att bestämma orsakssamband; dock är begränsningarna restriktiva och det saknas god förståelse. Därför introducerar vi en ny dynamisk systemvy för att förstå metoderna och deras begränsningar genom att koppla ihop optimal transport och kausal upptäckt. Dessutom tillhandahåller vi ett kausalt upptäcktskriterium och en robust optimal transport-baserad algoritm.
I den tredje artikeln diskuteras utvärderingen av kausala upptäcktsmetoder. Även om det är för förenklat att utvärdera kausala upptäcktsmetoder med syntetisk data genererad från slumpmässiga kausala grafer, så är uppsättningar av verklig referensdata med grund-sannings orsakssamband efterfrågade och inkluderar alltid praktiska frågor. Därför skapar vi en simulator för neuropatisk smärtdiagnos baserad på verkliga patientjournaler och domänkunskap. Simulatorn tillhandahåller sanna orsakssamband och genererar simuleringsdata som inte kan urskiljas av medicinska experter.
Slutligen undersökte vi en tillämpning av kausalitet: Rättvisa i maskininlärning. Många arbeten inom rättvisa är baserade på begränsningar av statiska statistiska mått över olika demografiska grupper. Det visar sig att beslut under sådana begränsningar kan leda till en skadlig långsiktig påverkan på den missgynnade gruppen. Därför tar vi hänsyn till de bakomliggande orsaksprocesserna, analyserar teoretiskt jämviktstillstånden i dynamiska system under olika rättvisa begränsningar, visar deras inverkan på jämviktstillstånd och introducerar potentiellt effektiva interventioner för att förbättra jämviktstillstånden.
Place, publisher, year, edition, pages
Stockholm, Sweden: KTH Royal Institute of Technology, 2023. p. 32
Series
TRITA-EECS-AVL ; 2023:6
Keywords
causal discovery, missing data, fairness, functional causal model
National Category
Computer Sciences
Research subject
Computer Science
Identifiers
urn:nbn:se:kth:diva-322513 (URN)978-91-8040-454-9 (ISBN)
Public defence
2023-02-02, F3, Lindstedtsvägen 26, Stockholm, 09:00 (English)
Opponent
Supervisors
Funder
Swedish e‐Science Research Center
Note
QC 20221217
2022-12-172022-12-162022-12-17Bibliographically approved