Je travaille dans l'économie politique, et beaucoup de modèles incluent des variables de contrôle "innocentes" telles que la population, les inégalités, l'héritage colonial, etc. afin que l'auteur puisse revendiquer l'impartialité de sa variable d'intérêt indépendante.
Mais si l'une de ces variables de contrôle est endogène à une variable omise, cela ne contamine-t-il pas l'impartialité de TOUTES les variables indépendantes?
Si c'est vrai, que pouvons-nous faire? Laissez ces variables de contrôle et elles conduisent elles-mêmes à un biais de variable omis. Incluez-les et ils contamineront tout dans le modèle.
Exemple: un chercheur veut savoir si l'inégalité mène à la violence, et il contrôle plusieurs choses: Voyant que l' inégalité est susceptible d'être endogène ( en raison de la variable omise Niveau d'altruisme ), il essaiera de trouver une variable instrumentale pour les inégalités . Mais la croissance et le développement ne sont-ils pas susceptibles d'être endogènes (c'est-à-dire en corrélation avec le niveau d'altruisme ) aussi?
Cet exemple peut sembler idiot, mais mon point est dans le travail d'économie politique / développement, il y a tellement de facteurs en jeu (pourtant omis) que je crains que de nombreuses variables incluses dans le LHS soient endogènes. Pourtant, souvent, le chercheur ne recherche un instrument que pour sa variable indépendante.
Réponses:
"Mais si l'une de ces variables de contrôle est endogène à une variable omise, cela ne contamine-t-il pas l'impartialité de TOUTES les variables indépendantes?"
Je ne veux pas trop insister là-dessus, mais il convient de mentionner que ce n'est pas vrai en général. Nous espérons que la dérivation suivante fournira une certaine compréhension de la "contamination" que vous mentionnez. Comme contre-exemple simple, supposons que le processus de génération de données soit donné par où n'est pas observé. Soit , et . Ensuite, il est clair que est "endogène". Mais notez que parce que , notre estimation de sera toujours correcte: Z C o v ( X 1 , Z ) = 0 C o v ( X 2 , Z ) ≠ 0 C o v ( X 1 , X 2 ) = 0 X 2 C o v ( X 1 ,
"Que pouvons-nous faire?"
L'un des principaux défis d'une bonne économétrie est de penser à des stratégies d'identification potentielles. Dans le type de situation que vous décrivez, il n'y a probablement rien d'autre à faire que d'essayer d'aborder le problème différemment.
la source
Tout est trop fort, mais probablement certains. Ce problème est appelé "maculage". Jetez un œil à la preuve dans les notes de cours de Greene sur la diapositive 5.
Emily Oster a un joli document de travail (et la commande Stata
psacalc
) qui peut aider à limiter le biais.la source
Dans le contexte de l'estimation des moindres carrés, la façon dont nous devons (tenter de) traiter l'endogénéité possible des régresseurs est par le biais de l'estimation des variables instrumentales. Cette approche ne dépend pas du fait d'avoir un seul régresseur endogène - vous pouvez en avoir plusieurs. Dans un tel cas, bien sûr, vous devez trouver plus d'instruments qui rendent les choses plus difficiles, mais en principe, la méthode fonctionnera de la même manière.
L'estimation IV ne résout pas le problème du biais, elle fournit seulement de la cohérence à l'estimateur. Mais rien ne résout le problème de la biais de l'exogénéité stricte elle-même (et il existe ensuite des méthodes de réduction des biais). Mais si vous jetez un coup d'œil sur un autre site SE, Cross Validated , qui concerne les statistiques, vous verrez que les statisticiens chevronnés n'accordent pas vraiment beaucoup d'importance à la propriété d'impartialité - ils se concentrent sur l'efficacité quadratique moyenne pour les propriétés des échantillons finis, et sur la cohérence pour les grandes propriétés des échantillons.
la source
Ceci est un exemple de ce que le statisticien Andrew Gelman appelle «l'erreur de contrôler un résultat intermédiaire». Voici sa description de cette erreur qui surgit lorsque les chercheurs demandent si avoir plus de filles change votre politique. La décision d'avoir un deuxième enfant est nécessairement conditionnelle à la décision précédente d'avoir le premier enfant, et semble donc être un exemple clair de contrôle de la variable de décision qui était endogène.
Le fait d'avoir des fils vous rend-il plus conservateur? Peut-être peut-être pas. Un problème avec le contrôle d'un résultat intermédiaire
En ce qui concerne votre commentaire selon lequel «laissez ces variables de contrôle en dehors et elles entraînent elles-mêmes un biais de variable omis», cela semble dépendre du type d'instrument que vous obtenez. Un bon instrument, qui satisfait vraiment les exigences, doit être indépendant du terme d'erreur dans la deuxième étape et être indépendant de tout ce que vous contrôlez directement . Autrement dit, l'instrument ne modifie Y que par X. Un instrument approprié pour les inégalités doit donc être indépendant de la croissance et du développement (bonne chance pour le trouver!) Si nous pensons que l'équation de la violence est l'équation structurelle de la violence.
la source
Comme d'autres articles l'ont souligné, les régresseurs endogènes peuvent contaminer toutes les estimations de paramètres en régression lorsque les régresseurs sont corrélés.
Considérons le modèle suivant (analogue à la notation de @ jmbejara)
Maintenant, si est endogène mais n'est pas dans le sens où toute corrélation entre et disparaîtra après avoir contrôléX 1 X 1 Z X 2X2 X1 X1 Z X2 , c'est-à-dire,
X1X2
la source