Effet causal par les ajustements de la porte arrière et de la porte d'entrée

12

Si nous voulions calculer l'effet causal de sur dans le graphique causal ci-dessous, nous pouvons utiliser à la fois les théorèmes d'ajustement de porte arrière et d'ajustement de porte d'entrée, c'est-à-dire XY

P(y|do(X=x))=uP(y|x,u)P(u)

et

P(y|do(X=x))=zP(z|x)xP(y|x,z)P(x).

Est-ce un devoir facile de montrer que les deux ajustements conduisent au même effet causal de sur ?XY

Graphique

Jae
la source
Est-ce un vrai devoir? Veuillez ensuite ajouter la balise d'auto-apprentissage. Ensuite, les gens peuvent vous donner des conseils, vous laissant la réflexion (et l'apprentissage). Dites-nous ce que vous avez essayé et où vous êtes coincé. Rappelez-vous que CV n'est pas pour l'externalisation des devoirs ...
Knarpie
5
Salut Knarpie, c'est une partie de l'auto-apprentissage et non un devoir. Je lis actuellement "Inférence causale dans les statistiques" par Pearl et al. et passer environ 1 heure à réfléchir à la question que j'ai posée ci-dessus, car c'est une question naturelle à poser, mais ne pouvait pas montrer l'égalité. Soit je manque quelque chose ici, soit les deux expressions ne sont pas égales.
Jae

Réponses:

12

L'action correspond à une intervention sur la variable qui la met àX xdo(x)Xx . Lorsque nous intervenons sur , cela signifie que les parents de n'affectent plus sa valeur, ce qui correspond à la suppression des flèches pointant vers Représentons donc cette intervention sur un nouveau DAG.X XXXX

entrez la description de l'image ici

Appelons la distribution d'observation originale et la distribution post-intervention . Notre objectif est d'exprimer en termes de . Notez que dans nous avons que . De plus, les probabilités pré-interventionnelles et post-interventionnelles partagent ces deux invariances: et puisque nous n'avons pas touché toute flèche entrant dans ces variables dans notre intervention. Donc:P P P P U X P ( U ) = P ( U ) P ( Y | X , U ) = P ( Y | X , U )PPPPPUXP(U)=P(U)P(Y|X,U)=P(Y|X,U)

P(Y|do(X)):=P(Y|X)=UP(Y|X,U)P(U|X)=UP(Y|X,U)P(U)=UP(Y|X,U)P(U)

La dérivation de la porte d'entrée est un peu plus élaborée. Remarquez d'abord qu'il n'y a pas de confusion entre et , donc,ZXZ

P(Z|do(X))=P(Z|X)

De plus, en utilisant la même logique pour dériver nous voyons que le contrôle de est suffisant pour dériver l'effet de sur , c'est-à-direX Z YP(Y|do(X))XZY

P(Y|do(Z))=XP(Y|X,Z)P(X)

Où j'utilise le premier pour la commodité de la notation pour l'expression suivante. Donc, ces deux expressions sont déjà en termes de distribution pré-intervention, et nous avons simplement utilisé la logique de porte dérobée précédente pour les dériver.

La dernière pièce nous avons besoin est de déduire l'effet de sur combinant l'effet de sur et sur . Pour ce faire, notez dans notre graphique , puisque l'effet de sur est complètement médiée par et le trajet de porte dérobée de à est bloqué lors d'une intervention sur . Par conséquent:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX

P(Y|do(X))=ZP(Y|Z,do(X))P(Z|do(X))=ZP(Y|do(Z))P(Z|do(X))=ZXP(Y|X,Z)P(X)P(Z|X)=ZP(Z|X)XP(Y|X,Z)P(X)

Où peut être compris de la manière suivante: lorsque j'interviens sur , alors la distribution de change en ; mais j'interviens en fait sur donc je veux savoir à quelle fréquence prendrait une valeur spécifique quand je change , qui est .ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))

Par conséquent, les deux ajustements vous donnent la même distribution post-interventionnelle sur ce graphique, comme nous l'avons montré.


En relisant votre question, il m'est venu à l'esprit que vous pourriez être intéressé à montrer directement que le côté droit des deux équations est égal dans la distribution pré-interventionnelle (ce qu'elles doivent être, étant donné notre dérivation précédente). Ce n'est pas difficile de montrer directement aussi. Il suffit de montrer que dans votre DAG:

XP(Y|Z,X)P(X)=UP(Y|Z,U)P(U)

Notez que le DAG implique et alors:YX|U,ZUZ|X

XP(Y|Z,X)P(X)=X(UP(Y|Z,X,U)P(U|Z,X))P(X)=X(UP(Y|Z,U)P(U|X))P(X)=UP(Y|Z,U)XP(U|X)P(X)=UP(Y|Z,U)P(U)

Par conséquent:

ZP(Z|X)XP(Y|X,Z)P(X)=ZP(Z|X)UP(Y|Z,U)P(U)=UP(U)ZP(Y|Z,U)P(Z|X)=UP(U)ZP(Y|Z,X,U)P(Z|X,U)=UP(Y|X,U)P(U)
Carlos Cinelli
la source
2
C'est une réponse très bonne et exhaustive. Le morceau où vous identifiez l'effet causal à travers la porte d'entrée est cependant superflu (OP l'a déjà fait et il découle directement du théorème de la porte d'entrée), et il contient également une erreur: il n'y a pas de "loi du total probabilité "d'effets causaux. Autrement dit, n'est généralement pas égal à , mais plutôt , ce qui est clairement différent. Voir le grand livre Pearl aux pages 87-88.P(Y|do(X))ZP(Y|do(Z))P(Z|do(X)ZP(Y|Z,do(X))P(Z|do(X))
Julian Schuessler
@JulianSchuessler c'est pourquoi j'ai écrit «peut être pensé comme», comme un moyen d'aider à comprendre, mais pas littéralement de dire que c'est le cas. En ce qui concerne la dérivation de la porte d'entrée, il n'était pas clair que le PO savait comment l'obtenir, c'est pourquoi je l'ai mis là.
Carlos Cinelli
Très bonne réponse. Merci, Carlos. La deuxième partie de votre réponse était exactement ce que j'avais demandé. J'ai deux questions complémentaires ici. 1) Quelle stratégie de recherche avez-vous utilisée pour manipuler algébriquement les expressions dans votre deuxième réponse? (En louchant assez longtemps les expressions?) Étant donné que l'espace de recherche est grand, je me demande comment un algorithme peut être écrit pour pouvoir automatiquement arriver à la même conclusion.
Jae
2) Je ne savais pas non plus comment interpréter , car ma première intuition était comme la suggestion de Julian. Mais la Perle et le livre que j'ai mentionné utilise votre expression. Je me demande si, en général, lors de la factorisation d'une chaîne dirigée où le nœud de début est la cause et le nœud de fin est l'effet, chaque facteur doit être conditionné par et non sur , où est une note intermédiaire dans la chaîne.do ( Z ) Z ZzP(Y|do(Z)P(Z|do(X))do(Z)ZZ
Jae
1
@Jeevaka c'est une hypothèse encodée dans le DAG, impliquée par sa factorisation et l'hypothèse que le système est composé de pièces modulaires et autonomes. Ainsi, les changements de n'affectent pas . Une façon d'aider à y réfléchir consiste à noter les équations structurelles des deux modèles (modèle d'observation) et (modèle interventionnel), puis de dériver les distributions implicites et . Vous verrez que le conditionnel de étant donné et seront les mêmes dans les deux. P ( Y | X , U ) M M P P Y X UP(X,U)P(Y|X,U)MMPPYXU
Carlos Cinelli