kth.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Neuropathic Pain Diagnosis Simulator for Causal Discovery Algorithm Evaluation
KTH, School of Electrical Engineering and Computer Science (EECS), Intelligent systems, Robotics, Perception and Learning, RPL.ORCID iD: 0000-0003-1356-9653
Carnegie Mellon Univ, Pittsburgh, PA 15213 USA..
Karolinska Inst, Stockholm, Sweden..
KTH, School of Electrical Engineering and Computer Science (EECS), Intelligent systems, Robotics, Perception and Learning, RPL.ORCID iD: 0000-0002-5750-9655
Show others and affiliations
2019 (English)In: Advances in neural information processing systems 32 (NIPS 2019) / [ed] Wallach, H Larochelle, H Beygelzimer, A d'Alche-Buc, F Fox, E Garnett, R, Neural Information Processing Systems (NIPS) , 2019, Vol. 32Conference paper, Published paper (Refereed)
Abstract [en]

Discovery of causal relations from observational data is essential for many disciplines of science and real-world applications. However, unlike other machine learning algorithms, whose development has been greatly fostered by a large amount of available benchmark datasets, causal discovery algorithms are notoriously difficult to be systematically evaluated because few datasets with known ground-truth causal relations are available. In this work, we handle the problem of evaluating causal discovery algorithms by building a flexible simulator in the medical setting. We develop a neuropathic pain diagnosis simulator, inspired by the fact that the biological processes of neuropathic pathophysiology are well studied with well-understood causal influences. Our simulator exploits the causal graph of the neuropathic pain pathology and its parameters in the generator are estimated from real-life patient cases. We show that the data generated from our simulator have similar statistics as real-world data. As a clear advantage, the simulator can produce infinite samples without jeopardizing the privacy of real-world patients. Our simulator provides a natural tool for evaluating various types of causal discovery algorithms, including those to deal with practical issues in causal discovery, such as unknown confounders, selection bias, and missing data. Using our simulator, we have evaluated extensively causal discovery algorithms under various settings.

Place, publisher, year, edition, pages
Neural Information Processing Systems (NIPS) , 2019. Vol. 32
Series
Advances in Neural Information Processing Systems, ISSN 1049-5258 ; 32
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:kth:diva-278415ISI: 000535866904044Scopus ID: 2-s2.0-85090174576OAI: oai:DiVA.org:kth-278415DiVA, id: diva2:1464968
Conference
33rd Conference on Neural Information Processing Systems (NeurIPS), DEC 08-14, 2019, Vancouver, Canada
Note

QC 20200908

Available from: 2020-09-08 Created: 2020-09-08 Last updated: 2022-12-16Bibliographically approved
In thesis
1. A Further Step of Causal Discovery towards Real-World Impacts
Open this publication in new window or tab >>A Further Step of Causal Discovery towards Real-World Impacts
2023 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]

The goal of many sciences is to find causal relationships and understand underlying mechanisms. As the golden standard for finding causal relationships, doing randomized experiments can be difficult or impossible in some applications; hence, determining underlying causal relationships purely from observational data, i.e., causal discovery, has attracted more and more attention in many domains, such as earth science, biology, and healthcare. On the one hand, computational methods of causal discovery have been developed and improved significantly in the recent three decades. On the other hand, there are still many challenges in both practice and theory to further achieve real-world impacts. This thesis aims to introduce the typical methods and challenges of causal discovery and then elaborates on the contributions of the included papers that step forward to achieve more real-world impacts for causal discovery. It mainly covers four challenges: practical issues, understanding and generalizing the restrictive assumptions, the lack of benchmark data sets, and applications of causality in machine learning topics. Each included paper contributes to one of the challenges.

In the first paper, regarding causal discovery in the presence of missing data as one of the practical issues, we theoretically study the influence of missing values on causal discovery methods and then correct the errors in their results. Under mild assumptions, our proposed method provides asymptotically correct results.

In the second paper, we investigate the understanding of assumptions in a class of causal discovery methods. Such methods impose substantial constraints on functional classes and distributions of causal processes for determining causal relationships; however, the constraints are restrictive and there is a lack of good understanding. Therefore, we introduce a new dynamical-system view for understanding the methods and their constraints by connecting optimal transport and causal discovery. Furthermore, we provide a causal discovery criterion and a robust optimal transport-based algorithm. 

In the third paper, the evaluation of causal discovery methods is discussed. While it is too simplistic to evaluate causal discovery methods on synthetic data generated from random causal graphs, the real-world benchmark data sets with ground-truth causal relations are in great demand and always include practical issues. Thus, we create a neuropathic pain diagnosis simulator based on real-world patient records and domain knowledge. The simulator provides ground-truth causal relations and generates simulation data that cannot be distinguished by the medical expert. 

Finally, we explored an application of causality: Fairness in machine learning. Many fairness works are based on the constraints of static statistical measures across different demographic groups. It turns out that decisions under such constraints can lead to a pernicious long-term impact on the disadvantaged group. Therefore, we consider the underlying causal processes, theoretically analyze the equilibrium states of dynamical systems under various fairness constraints, show their impact on equilibrium states, and introduce potentially effective interventions to improve the equilibrium states. 

Abstract [sv]

Målet för många vetenskapsområden är att hitta orsakssamband och förstå bakomliggande mekanismer. Som den gyllene standarden för att hitta orsakssamband kan slumpmässiga experiment vara svåra eller omöjliga i vissa tillämpningar; Därför har bestämning av underliggande orsakssamband enbart från observationsdata, d.v.s. kausal upptäckt, väckt mer och mer uppmärksamhet inom många områden, såsom geovetenskap, biologi och sjukvård. Å ena sidan har beräkningsmetoder för kausal upptäckt utvecklats och förbättrats avsevärt under de senaste tre decennierna. Å andra sidan finns det fortfarande många utmaningar kvar i både praktik och teori för att ytterligare uppnå verkliga effekter. Denna avhandling syftar till att introducera de typiska metoderna och utmaningarna för kausal upptäckt och sedan utveckla bidragen från de inkluderade artiklarna som tar kliv framåt för att uppnå fler verkliga effekter för kausal upptäckt. Den täcker huvudsakligen fyra utmaningar: praktiska frågor, förståelse och generalisering av de restriktiva antagandena, bristen på uppsättningar av referensdata och tillämpningar av kausalitet i maskininlärningsområden. Varje medföljande artikel bidrar till en av utmaningarna.

I den första artikeln, angående kausal upptäckt i närvaro av saknade data som en av de praktiska frågorna, studerar vi teoretiskt saknade värdens inverkan på metoder för kausal upptäckt och korrigerar sedan felen i deras resultat. Under milda antaganden ger vår föreslagna metod korrekta resultat.

I den andra artikeln undersöker vi förståelsen av antaganden i en klass av kausala upptäcktsmetoder. Sådana metoder lägger betydande begränsningar på funktionella klasser och fördelningar av kausala processer för att bestämma orsakssamband; dock är begränsningarna restriktiva och det saknas god förståelse. Därför introducerar vi en ny dynamisk systemvy för att förstå metoderna och deras begränsningar genom att koppla ihop optimal transport och kausal upptäckt. Dessutom tillhandahåller vi ett kausalt upptäcktskriterium och en robust optimal transport-baserad algoritm.

I den tredje artikeln diskuteras utvärderingen av kausala upptäcktsmetoder. Även om det är för förenklat att utvärdera kausala upptäcktsmetoder med syntetisk data genererad från slumpmässiga kausala grafer, så är uppsättningar av verklig referensdata med grund-sannings orsakssamband efterfrågade och inkluderar alltid praktiska frågor. Därför skapar vi en simulator för neuropatisk smärtdiagnos baserad på verkliga patientjournaler och domänkunskap. Simulatorn tillhandahåller sanna orsakssamband och genererar simuleringsdata som inte kan urskiljas av medicinska experter.

Slutligen undersökte vi en tillämpning av kausalitet: Rättvisa i maskininlärning. Många arbeten inom rättvisa är baserade på begränsningar av statiska statistiska mått över olika demografiska grupper. Det visar sig att beslut under sådana begränsningar kan leda till en skadlig långsiktig påverkan på den missgynnade gruppen. Därför tar vi hänsyn till de bakomliggande orsaksprocesserna, analyserar teoretiskt jämviktstillstånden i dynamiska system under olika rättvisa begränsningar, visar deras inverkan på jämviktstillstånd och introducerar potentiellt effektiva interventioner för att förbättra jämviktstillstånden.

Place, publisher, year, edition, pages
Stockholm, Sweden: KTH Royal Institute of Technology, 2023. p. 32
Series
TRITA-EECS-AVL ; 2023:6
Keywords
causal discovery, missing data, fairness, functional causal model
National Category
Computer Sciences
Research subject
Computer Science
Identifiers
urn:nbn:se:kth:diva-322513 (URN)978-91-8040-454-9 (ISBN)
Public defence
2023-02-02, F3, Lindstedtsvägen 26, Stockholm, 09:00 (English)
Opponent
Supervisors
Funder
Swedish e‐Science Research Center
Note

QC 20221217

Available from: 2022-12-17 Created: 2022-12-16 Last updated: 2022-12-17Bibliographically approved

Open Access in DiVA

fulltext(6388 kB)170 downloads
File information
File name FULLTEXT01.pdfFile size 6388 kBChecksum SHA-512
5ceeba1b0c48e7d3c25a96566b3907f38cd561717eb443ca5b608c8293dae2431740e3f77322d56c561f0676862a91e8737cdf3c173b236fd3ee09b5752e98f5
Type fulltextMimetype application/pdf

Scopus

Authority records

Tu, RuiboKjellström, Hedvig

Search in DiVA

By author/editor
Tu, RuiboKjellström, Hedvig
By organisation
Robotics, Perception and Learning, RPL
Computer Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 170 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 184 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf