Pourquoi ne pas utiliser directement la variable instrumentale comme covariable dans la régression?

8

Je sais que c'est une question idiote, car je connais la théorie des variables instrumentales et la régression en deux étapes. Pourtant, je n'ai jamais vu de réponse claire à ce qui suit:

supposons que vous avez une endogénéité due à une variable non observée corrélée avec l'un des régresseurs initiaux. La manière typique de corriger cela est de trouver une variable instrumentale corrélée à l'effet non observé et d'utiliser une approche de régression en deux étapes.

Maintenant ma question est, pourquoi passer par ce problème - pourquoi ne pas simplement inclure la variable instrumentale comme régresseur standard dans l'estimation initiale?

regression least-squares instrumental-variables Daniel
la source

12

Le point de régression des variables instrumentales est de fournir une estimation non biaisée de l'effet causal de l'exposition $X$ sur le résultat $O$ , lorsqu'il existe une variable non mesurée, éventuellement non mesurable $U$ confondre la relation entre $X$ et $O$ . Voici un DAG de la circonstance la plus simple dans laquelle on utiliserait l'estimation de variables instrumentales ( $X$ , $U$ , et $Z$ peut être des ensembles de variables):

DAG de la relation variable instrumentale: la variable instrumentale Z provoque X. La variable non mesurée U provoque X et O. La variable mesurée X provoque la variable O.

Si une variable instrumentale $Z$ les causes $X$ , n'a aucun effet sur $O$ autrement que par $X$ , il n'y a pas de cause antérieure des deux $Z$ et $O$ , et l'effet de $X$ sur $O$ est homogène, alors avec un échantillon suffisamment grand $E[O|\hat{X}]$ où $\hat{X} = E[X|Z]$ peut fournir une estimation non biaisée de l’effet causal $X$ sur $O$ .

En résumé, vous ne vous souciez pas de l'effet de $Z$ sur $O$ (il n'y en a pas sauf par $X$ ), et $E[O|\hat{X}] \ne E[O|X,Z]$ , donc simplement $Z$ dans votre modèle ne vous donnera pas d'estimation de variable instrumentale.

Commentaire final: Le "... dans l'estimation initiale?" la fermeture de votre question me donne envie de clarifier: une première estimation $\hat{X}$ (donc $Z$ fait en effet partie de cette estimation), et on utilise $\hat{X}$ comme prédicteur dans la deuxième estimation (sans $Z$ ).

Alexis
la source

3

Vous pouvez et les gens le font. Comme le souligne @Alexis, cela ne vous donne pas une réponse complète.

Imaginez que vous vous intéressez à l'effet d'une variable endogène $X$ sur $Y$ et $Z$ est un instrument pour $X$ . Lors d'une IV en économétrie:

La régression de $X$ sur $Z$ est appelé la régression de première étape .
La régression de $Y$ sur $Z$ est appelé la régression de forme réduite .

La régression de forme réduite ne permet pas à elle seule d'estimer l'effet de $X$ sur $Y$ .

Matthew Gunn
la source

Pourquoi ne pas utiliser directement la variable instrumentale comme covariable dans la régression?

Réponses: