Non-confusion dans le modèle causal de Rubin - explication de Layman

12

Lors de la mise en œuvre du modèle causal de Rubin, l'une des hypothèses (non testables) dont nous avons besoin est la non-confusion, ce qui signifie

(Y(0),Y(1))T|X

Lorsque le LHS sont les contrefactuels, le T est le traitement et X sont les covariables que nous contrôlons.

Je me demande comment décrire cela à une personne qui ne connaît pas grand-chose au modèle causal de Rubin. Je comprends pourquoi, théoriquement, nous avons besoin de cette hypothèse, mais je ne suis pas certain sur le plan conceptuel pourquoi cela est important. Plus précisément, si T est le traitement, le résultat potentiel ne devrait-il pas en être très dépendant? De plus, si nous avons un essai contrôlé randomisé, alors automatiquement, . Pourquoi est-ce vrai?(Y(0),Y(1))T

Comment décririez-vous l'hypothèse du caractère illimité / ignorant à quelqu'un qui n'a pas étudié la MRC?

RayVelcoro
la source
En ce qui concerne l'appariement des scores de propension, il est tout d'abord facile de prouver que la distribution conditionnelle de coïncide avec la distribution conditionnelle de . Par conséquent, la non-confusion / ignorabilité implique que . Pour les essais randomisés, doit être indépendant de toute autre variable participant aux essais. X | T = 0 , pX | T=1,p(X)=q( Y ( 0 ) , Y ( 1 ) ) T | p ( X ) TX | T=0,p(X)=q(Y(0),Y(1))  T | p(X)T
Viktor

Réponses:

11

Comment décririez-vous l'hypothèse du caractère illimité / ignorant à quelqu'un qui n'a pas étudié la MRC?

En ce qui concerne l'intuition à quelqu'un qui ne connaît pas l'inférence causale, je pense que c'est là que vous pouvez utiliser des graphiques. Ils sont intuitifs dans le sens où ils montrent visuellement le «flux» et ils montreront également clairement ce que signifie l'ignorabilité dans le monde réel.

L'ignorabilité conditionnelle équivaut à affirmer que satisfait au critère de porte dérobée. Donc, en termes intuitifs, vous pouvez dire à la personne que les covariables que vous avez choisies pour "bloquent" l'effet des causes courantes de et (et n'ouvrent aucune autre association parasite).X T YXXTY

Si les seules variables de confusion concevables de votre problème sont les variables sur lui-même, alors cela est trivial à expliquer. Vous dites simplement que puisque conteste toutes les causes courantes de et , c'est tout ce que vous devez contrôler. Vous pouvez donc lui dire que c'est ainsi que vous voyez le monde:X T YXXTY

entrez la description de l'image ici

Le cas le plus intéressant est celui où il pourrait y avoir d'autres facteurs de confusion plausibles. Pour être plus précis, vous pouvez même demander à la personne de nommer un facteur de confusion potentiel de votre problème - qui est, lui demander de nommer quelque chose qui provoque à la fois et , mais pas dans .Y XTYX

Dites les noms de personnes une variable . Ensuite , vous pouvez dire à cette personne que ce que votre hypothèse de ignorabilité conditionnelle signifie effectivement que vous pensez sera « bloc » l'effet de sur et / ou . X Z T YZXZTY

Et vous devriez lui donner une raison substantielle pour laquelle vous pensez que c'est vrai. Il existe de nombreux graphiques qui pourraient représenter cela, mais supposons que vous arriviez à cette explication: " ne biaisera pas les résultats parce que même si provoque et , son effet sur ne passe que par , que nous contrôlons". Z T Y T XZZTYTXEt puis montrez ce graphique:

entrez la description de l'image ici

Et vous pourriez penser à d'autres cofondateurs et lui montrer comment bloque visuellement sur les graphiques.X

Répondant maintenant aux questions conceptuelles:

Plus précisément, si T est le traitement, le résultat potentiel ne devrait-il pas en être très dépendant? De plus, si nous avons un essai contrôlé randomisé, alors automatiquement,. Pourquoi est-ce vrai?

Pensez à comme à la tâche de traitement. Ce que cela dit, c'est que vous attribuez le traitement à des personnes «ignorant» comment elles réagissent au traitement (les résultats potentiels contrefactuels). Une simple violation de cela serait que vous ayez tendance à donner le traitement à ceux qui pourraient en bénéficier le plus.T

C'est aussi pourquoi cela se produit automatiquement lorsque vous randomisez. Si vous choisissez les traités au hasard, cela signifie que vous n'avez pas vérifié leurs réponses potentielles au traitement pour les sélectionner.


Pour compléter la réponse, il convient de noter qu'il est vraiment difficile de comprendre l'ignorabilité sans parler du processus causal, c'est-à-dire sans invoquer des équations structurelles / modèles graphiques. La plupart du temps, vous voyez des chercheurs faire appel à l'idée que "le traitement était comme aléatoire", mais sans justifier pourquoi c'est ou pourquoi c'est plausible en utilisant des mécanismes et des processus du monde réel.

En fait, de nombreux chercheurs supposent simplement l'ignorabilité par commodité, afin de justifier l'utilisation de méthodes statistiques. Ce passage de l'article de Joffe, Yang et Feldman révèle une vérité gênante que la plupart des gens connaissent mais ne disent pas lors des présentations de la conférence: "Les hypothèses d'ignorabilité sont généralement faites parce qu'elles justifient l'utilisation des méthodes statistiques disponibles, et non parce qu'elles sont vraiment crues."

Mais, comme je l'ai dit au début de la réponse, vous pouvez utiliser des graphiques pour déterminer si une affectation de traitement est ignorable ou non. Bien que le concept d'ignorabilité lui-même soit difficile à saisir, car il énonce des jugements sur les quantités contrefactuelles, dans les graphiques, vous faites essentiellement des déclarations qualitatives sur les processus causaux (cette variable provoque cette variable, etc.), qui sont faciles à expliquer et visuellement attrayants.

Comme mentionné dans une réponse précédente, il existe une équivalence formelle entre les graphiques et les résultats potentiels . Par conséquent, vous pouvez également lire les résultats potentiels des graphiques. Pour rendre cette connexion plus formelle (pour plus d'informations, voir la causalité de Pearl, p. 343), vous pourriez recourir à la définition suivante: les résultats potentiels représenteraient le total de toutes les variables (termes observés et termes d'erreur) qui affectent Y lorsque T est maintenu constant. .

Ensuite, il est facile de voir pourquoi l'ignorabilité tient dans RCT, mais plus important encore, il vous permet également de repérer facilement les situations où l'ignorabilité ne tient pas. Par exemple, dans le graphique , T est ignorable, mais T n'est pas conditionnellement ignorable étant donné X, car une fois que vous conditionnez sur X, vous ouvrez un chemin de collision du terme d'erreur de X à T.TXY

Pour résumer, de nombreux chercheurs font l'hypothèse d'ignorabilité par défaut, pour plus de commodité. C'est un moyen pratique de supposer la suffisance d'un ensemble de contrôles sans avoir à justifier formellement pourquoi c'est le cas, mais pour expliquer ce que cela signifie dans un contexte réel pour un profane, vous devez invoquer une histoire causale, c'est-à-dire des hypothèses causales , et vous pouvez officiellement raconter cette histoire à l'aide de graphiques causaux.

Carlos Cinelli
la source
8

(Y0,Y1)Y

X

Y=TY1+(1T)Y0.

YTTY1(1T)Y0

TXXY1X

Dimitriy V. Masterov
la source
En regardant la partie où vous dites "Je pense que vous vous bloquez sur la différence entre les résultats potentiels (Y0, Y1) et le résultat observé Y. Ce dernier est très influencé par le traitement, mais nous espérons que l'ancienne paire ne l'est pas. " Cela peut-il être interprété comme «le résultat observé dépend du traitement, mais sous l'hypothèse nulle d'absence d'effet du traitement, le traitement ne devrait pas influencer les résultats potentiels»? Pourquoi espérons-nous que les résultats potentiels sont influencés par les traitements
RayVelcoro
1
Y1Y0
TY1(1T)Y0YT
@ user321627 Si vous calculez la différence des moyennes des résultats observés pour le traitement et le contrôle, cela devrait être évident.
Dimitriy V. Masterov