Quelle est la définition mathématique d'une relation causale entre deux variables aléatoires?
Étant donné un échantillon de la distribution conjointe de deux variables aléatoires et , quand dirions-nous que cause ?
Pour le contexte, je lis cet article sur la découverte causale .
machine-learning
causality
Jeanne
la source
la source
Réponses:
Mathématiquement, un modèle causal consiste en des relations fonctionnelles entre variables. Par exemple, considérons le système d'équations structurelles ci-dessous:
Cela signifie que détermine fonctionnellement la valeur de (si vous intervenez sur cela change les valeurs de ) mais pas l'inverse. Graphiquement, ceci est généralement représenté par , ce qui signifie que entre dans l'équation structurelle de y. En complément, vous pouvez également exprimer un modèle causal en termes de distributions conjointes de variables contrefactuelles, qui est mathématiquement équivalent aux modèles fonctionnels .x y x y x→y x
Parfois (ou la plupart du temps) vous ne connaissez pas la forme des équations structurelles ,fx fy x→yy→xp(y,x) , ni même si ou . La seule information dont vous disposez est la distribution de probabilité conjointe (ou des échantillons de cette distribution).x→y y→x p(y,x)
Cela conduit à votre question: quand puis-je récupérer le sens de la causalité uniquement à partir des données? Ou, plus précisément, quand puis-je récupérer six entre dans l'équation structurelle de y ou vice-versa, uniquement à partir des données?
Bien sûr, sans hypothèses fondamentalement non vérifiables sur le modèle causal, cela est impossible . Le problème est que plusieurs modèles de causalité différents peuvent entraîner la même distribution de probabilité conjointe des variables observées. L'exemple le plus courant est un système linéaire causal avec bruit gaussien.
Mais sous certaines hypothèses causales, cela pourrait être possible - et c'est sur cela que la littérature sur la découverte causale travaille. Si vous n'avez aucune exposition préalable à ce sujet, vous voudrez peut-être commencer par Elements of Causal Inference de Peters, Janzing et Scholkopf, ainsi que le chapitre 2 de Causality de Judea Pearl. Nous avons un sujet ici sur CV pour les références sur la découverte causale , mais nous n'avons pas encore beaucoup de références énumérées ici.
Par conséquent, il n'y a pas qu'une seule réponse à votre question, car cela dépend des hypothèses que l'on fait. L'article que vous mentionnez cite quelques exemples, comme l'hypothèse d'un modèle linéaire avec un bruit non gaussien . Ce cas est connu sous le nom de LINGAN (abréviation de modèle acyclique linéaire non gaussien), voici un exemple dans
R
:Notez ici que nous avons un modèle causal linéaire avec un bruit non gaussien oùx2 provoque x1 et lingam récupère correctement la direction causale. Cependant, notez que cela dépend essentiellement des hypothèses LINGAM.
Pour le cas de l'article que vous citez, ils font cette hypothèse spécifique (voir leur "postulat"):
Six→y , la longueur de description minimale du mécanisme mappant X à Y est indépendante de la valeur de X, tandis que la longueur de description minimale du mécanisme mappant Y à X dépend de la valeur de Y.
Notez qu'il s'agit d'une hypothèse. C'est ce que nous appellerions leur "condition d'identification". Essentiellement, le postulat impose des restrictions sur la distribution conjointep(x,y) . C'est-à-dire que le postulat dit que si x→y certaines restrictions s'appliquent aux données, et si y→x autres restrictions s'appliquent. Ces types de restrictions qui ont des implications testables (imposent des contraintes sur p(y,x) ) sont ce qui permet de récupérer de manière directionnelle à partir de données d'observation.
Enfin, les résultats de la découverte causale sont encore très limités et dépendent d'hypothèses solides, soyez prudent lorsque vous les appliquez au contexte réel.
la source
lm
). Nous ne pouvons pas tous travailler autour des échantillons d'observation des jeux de données de Tuebingen pour avoir une idée de la découverte causale! :)Il existe une variété d'approches pour formaliser la causalité (ce qui correspond à un désaccord philosophique important sur la causalité qui existe depuis des siècles). Un résultat populaire concerne les résultats potentiels. L'approche des résultats potentiels, appelée le modèle causal Rubin , suppose que pour chaque état de cause, il existe une variable aléatoire différente. Ainsi,Y1 pourrait être la variable aléatoire des résultats possibles d'un essai clinique si un sujet prend le médicament à l'étude, et Y2 pourrait être la variable aléatoire s'il prend le placebo. L'effet causal est la différence entre Y1 et Y2 . Si en fait Y1=Y2 , on pourrait dire que le traitement n'a aucun effet. Sinon, nous pourrions dire que la condition de traitement entraîne le résultat.
Les relations causales entre les variables peuvent également être représentées par des graphiques acyliques directionnels , qui ont une saveur très différente mais se révèlent mathématiquement équivalents au modèle Rubin (Wasserman, 2004, section 17.8).
Wasserman, L. (2004). Toutes les statistiques: un cours concis en inférence statistique . New York, NY: Springer. ISBN 978-0-387-40272-7.
la source
Une intervention est une modification chirurgicale d'une variable qui n'affecte pas les variables dont elle dépend. Les interventions ont été rigoureusement formalisées dans les équations structurelles et les modèles graphiques causaux, mais pour autant que je sache, il n'y a pas de définition indépendante d'une classe de modèle particulière.
Dans les approches modernes de la causalité, l'intervention est considérée comme l'objet primitif qui définit les relations causales (définition 1). À mon avis, cependant, l'intervention est le reflet de la dynamique de simulation et est nécessairement compatible avec celle-ci.
la source