Variables d'instrument et restriction d'exclusion du point de vue de la médiation

8

J'ai du mal à comprendre la restriction d'exclusion dans les variables instrumentales.

Je comprends que l'effet du traitement non biaisé est , où est le résultat, est le traitement et est l'instrument. En d'autres termes, .B=Cov(Oui,Z)Cov(S,Z)OuiSZB=jeTTTaux de conformité

Cependant, si j'y réfléchis dans un cadre de médiation et applique la restriction d'exclusion, cela a de moins en moins de sens.

Dans un cadre de médiation, ITT = l'effet total, ou . Ainsi, l'effet du traitement non biaisé est:Cov(S,Z)Cov(Oui,S)+Cov(Oui,Z|S)

(Cov(S,Z)Cov(Oui,S)+Cov(Oui,Z|S))Cov(S,Z) , qui se réduit à:

Cov(Oui,S)+Cov(Oui,Z|S)Cov(S,Z) ,

ainsi, l'estimation causale non biaisée est l'effet du traitement biaisé + l'effet de l'instrument ( .controllingforthetreatmentcompliancerate

Cependant, avec la restriction d'exclusion, il n'est pas censé y avoir d'effet de l'instrument une fois que nous contrôlons le traitement.

Un exemple, tiré de l'exemple Sesman Street de Gelman. Tout d'abord, obtenir l'effet de traitement non biaisé via 2SLS:

fit.2s <- lm(regular ~ encour, data = df)
watched.hat <- fit.2s$fitted
fit.2b <- lm(postlet ~ watched.hat, data = df)
summary(fit.2b)

ce qui donne la réponse, 7,934.

Et maintenant, dans un cadre SEM:

library(foreign)
library(lavaan)
mod  <-
'
regular ~ a*encour
postlet ~ b*regular + c*encour
ind := a*b
total := a*b + c
'
fit <- sem(mod, data = df)
summary(fit)

 Regressions:
               Estimate  Std.Err  Z-value  P(>|z|)
  regular ~                                           
encour     (a)    0.362    0.051    7.134    0.000

  postlet ~                                           
  regular    (b)   13.698    2.079    6.589    0.000
  encour     (c)   -2.089    1.802   -1.160    0.246


  Defined Parameters:
               Estimate  Std.Err  Z-value  P(>|z|)
  ind               4.965    1.026    4.840    0.000
  total             2.876    1.778    1.617    0.106

13,698 - 2,089 / 0,362 = 7,92

Ainsi, la seule raison pour laquelle l'effet de traitement non biaisé n'est pas seulement l'effet de traitement biaisé est qu'il existe toujours un effet de l'instrument lors du contrôle du traitement, qui, selon la restriction d'exclusion, ne devrait pas se produire.

Est-ce que j'ai râté quelque chose?

sam
la source

Réponses:

1

Vous déclarez correctement que sous les hypothèses IV de style TARDIF avec un effet causal du IV Z sur le traitement S, instrument exogène, et aucun effet direct sur le résultat Y, votre effet de traitement B de S sur Y est identifié comme

Cov(Oui,Z)/Cov(S,Z)=jeTT/CompljeunenceRunete

Si clairement,

jeTT=Cov(Oui,Z) ,

et non , comme vous l'avez dit par erreur. Cela est également intuitivement clair car si l'instrument est exogène par rapport au traitement et au résultat, ses effets causals sont identifiés et (sous linéarité) sont simplement la corrélation entre l'instrument et le résultat.Cov(S,Z)Cov(Oui,S)+Cov(Oui,Z)

Vous semblez en outre impliquer que les IV et Y ne devraient pas être liés dans une régression de Y sur le traitement et l'IV. Ce n'est pas le cas si le traitement S est réellement endogène. Ensuite, c'est un collisionneur, car il est causé par le IV et le terme d'erreur non observé de Y. Le conditionnement sur le traitement rend le IV et le terme d'erreur dépendants, et donc aussi le IV et Y. Donc, vous obtenez un non-zéro coefficient de régression même si la restriction d'exclusion est valide. Cela devrait être très clair si vous dessinez le graphique causal.

Si ce n'était pas le cas, nous pourrions tester la restriction d'exclusion, mais bien sûr, nous savons que nous ne pouvons généralement pas la tester! (Du moins pas si facilement).

Julian Schuessler
la source
J'ai ajouté une modification pour clarifier, mais du point de vue de la médiation, l'ITT est (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z). Ceci est vérifiable avec l'exemple de Gelman: coef (summary (lm (postlet ~ encour, data = df))) ['encour',] ['Estimate'] = 2.88. À partir de la sortie SEM, (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)) / Cov (S, Z) = 2,88 (l'estimation à côté du total, qui est a * b + c)
sam
Alors, comment peut-il être également vrai que Cov (Y, Z) / Cov (S, Z) = ITT / ComplianceRate? Votre équation pour l'ITT et la formule IV ne peut pas être vraie en même temps. Avec la restriction d'exclusion, votre formule n'est pas vraie.
Julian Schuessler
1
Notez également que «du point de vue de la médiation», l'ITT est une quantité causale, doit donc être définie dans les résultats potentiels ou avec l'opérateur do, et non en fonction du PDF de l'observable. Ainsi, l'ITT est défini comme étant E (Y | do (Z)), par exemple. Voir en.wikipedia.org/wiki/… .
Julian Schuessler
Parce que Cov (Y, Z) peut être décomposé en (Cov (S, Z) ⋅Cov (Y, S) + Cov (Y, Z | S)). Peut-être que je manque quelque chose ici, mais c'est un peu mon point: l'identification de l'impact causal repose sur la restriction d'exclusion pour être fausse, ou du moins il semble.
sam
J'ai édité ma réponse. Je ne comprends toujours pas parfaitement votre confusion. Vous pourriez trouver très éclairant de lire Pearl, Judea. "Modèles linéaires: un" microscope "utile pour l'analyse causale." Les outils qui s'y trouvent sont extrêmement faciles et expliquent à quel point ce problème est simple.
Julian Schuessler