Que signifie exactement la «validité d'un instrument»?
Dans mon cours d'économétrie, nous venons de définir la validité de l'instrument comme , où est la variable instrumentale et est le terme d'erreur d'un modèle de régression univarié. Ensuite, nous avons également parlé de la force d'un instrument, mais je suis presque sûr d'avoir bien compris qu'il s'agit d'une exigence différente de la validité.
Dans les applications, je trouve souvent la définition de la validité comme , où est l'instrument et est la variable explicative endogène, plus l'exigence que (comme ci-dessus), qui est généralement défini comme une restriction d'exclusion.
Je suis un peu confus et il n'est pas si facile de trouver le type d'amorce sur les approches IV dont j'ai besoin. Quelqu'un peut-il résoudre ces problèmes?
Réponses:
Les conditions requises pour que Z soit un instrument valide pour X sont:
L'idée principale derrière IV est que lorsque Z change, il devrait également modifier X, mais pas la partie gênante de X qui est corrélée à l'erreur. Pour obtenir l'effet de X sur Y, nous n'utilisons qu'une partie de la variation de X, la partie qui est entraînée par la variation de Z.
la source
Après l' inférence causale de Hernán et Robins , chapitre 16: Estimation des variables instrumentales, les variables instrumentales ont quatre hypothèses / exigences:
Il ne doit pas y avoir de cause préalable des deux et .Y Z
L' effet de sur doit être homogène. Cette hypothèse / exigence a deux formes, faible et forte :X Y
Les instruments qui ne satisfont pas à ces hypothèses sont généralement invalides. (2) et (3) sont généralement difficiles à fournir des preuves solides (d'où des hypothèses ).
La version forte de la condition (4) peut être une hypothèse très déraisonnable à faire selon la nature des phénomènes étudiés (par exemple, les effets des médicaments sur la santé des individus varient généralement d'un individu à l'autre). La version faible de la condition (4) peut nécessiter l'utilisation d'estimateurs IV atypiques, selon les circonstances.
La faiblesse de l'effet de sur n'a pas vraiment de définition formelle. Certes, l'estimation IV produit des résultats biaisés lorsque l'effet de sur est faible par rapport à l'effet de (facteur de confusion non mesuré) sur , mais il n'y a pas de point dur et rapide, et le biais dépend de la taille de l'échantillon. Hernán et Robins critiquent (respectueusement et de manière constructive) l'utilité de la régression IV par rapport aux estimations basées sur le raisonnement causal formel de leur approche (c'est-à-dire l'approche du raisonnement causal formel des gens de causalité contrefactuelle comme Pearl, etc.).Z X Z X U X
Hernán, MA et Robins, JM (2017). Inférence causale . Chapman & Hall / CRC.
la source
Les deux hypothèses peuvent être vues en examinant le système d'équations:
La force de l'instrument est liée au coefficient et au de cette équation (les deux doivent être suffisamment élevés)γ2≠0 R2
La validité est liée à l'hypothèse que , c'est-à-dire que n'a pas d'effet direct sur .γ3=0 z y
Notez que nous ne pouvons pas tester , seulement l'assumer, ce qui explique pourquoi on l'appelle une hypothèse d' identification (= non testable).γ3=0
la source