Pourquoi ne pas utiliser directement la variable instrumentale comme covariable dans la régression?

8

Je sais que c'est une question idiote, car je connais la théorie des variables instrumentales et la régression en deux étapes. Pourtant, je n'ai jamais vu de réponse claire à ce qui suit:

  • supposons que vous avez une endogénéité due à une variable non observée corrélée avec l'un des régresseurs initiaux. La manière typique de corriger cela est de trouver une variable instrumentale corrélée à l'effet non observé et d'utiliser une approche de régression en deux étapes.

Maintenant ma question est, pourquoi passer par ce problème - pourquoi ne pas simplement inclure la variable instrumentale comme régresseur standard dans l'estimation initiale?

Daniel
la source

Réponses:

12

Le point de régression des variables instrumentales est de fournir une estimation non biaisée de l'effet causal de l'exposition X sur le résultat O, lorsqu'il existe une variable non mesurée, éventuellement non mesurable U confondre la relation entre X et O. Voici un DAG de la circonstance la plus simple dans laquelle on utiliserait l'estimation de variables instrumentales (X, U, et Z peut être des ensembles de variables):

Si une variable instrumentaleZ les causes X, n'a aucun effet sur O autrement que par X, il n'y a pas de cause antérieure des deux Z et O, et l'effet de X sur O est homogène, alors avec un échantillon suffisamment grand E[O|X^]X^=E[X|Z] peut fournir une estimation non biaisée de l’effet causal X sur O.

En résumé, vous ne vous souciez pas de l'effet de Z sur O (il n'y en a pas sauf par X), et E[O|X^]E[O|X,Z], donc simplement Z dans votre modèle ne vous donnera pas d'estimation de variable instrumentale.

Commentaire final: Le "... dans l'estimation initiale?" la fermeture de votre question me donne envie de clarifier: une première estimationX^ (donc Z fait en effet partie de cette estimation), et on utilise X^ comme prédicteur dans la deuxième estimation (sans Z).

Alexis
la source
3

Vous pouvez et les gens le font. Comme le souligne @Alexis, cela ne vous donne pas une réponse complète.

Imaginez que vous vous intéressez à l'effet d'une variable endogène X sur Oui et Z est un instrument pour X. Lors d'une IV en économétrie:

  • La régression de X sur Zest appelé la régression de première étape .
  • La régression de Oui sur Zest appelé la régression de forme réduite .

La régression de forme réduite ne permet pas à elle seule d'estimer l'effet de X sur Oui.

Matthew Gunn
la source