Commençons par supposer que j'ai des données transversales sur , , (voir ci-dessous pour y , x_1 , x_2 ).
Je veux estimer l'effet des variables et et leur interaction ( ) sur la variable utilisant l'approche de la fonction de contrôle, et il est fort probable que et soient endogènes. J'ai deux instruments, et . J'évalue les deux équations du premier étage suivantes et j'enregistre les résidus prévus de la manière suivante:
ivreg2 x1 z1 z2
predict error1hat, residuals
ivreg2 x2 z1 z2
predict error2hat, residuals
Une fois que j'ai enregistré les résidus prévus, j'évalue l'équation du deuxième étage de la manière suivante:
ivreg2 y x1 x2 x3 error1hat error2hat
Même si les coefficients estimés de , et un sens, je sais que les erreurs standard ne sont pas correctes (voir page 8 de http://eml.berkeley.edu/~train/petrintrain.pdf ).
À la page 8 de http://eml.berkeley.edu/~train/petrintrain.pdf , les auteurs suggèrent d'utiliser le bootstrap pour obtenir des erreurs standard corrigées pour , et .
Mes questions sont :
- Comment dois-je configurer le bootstrap?
- Le bootstrap est-il appliqué uniquement à l'équation du deuxième étage, ou est-il appliqué à la fois à l'équation du premier et du deuxième étage?
Supposons maintenant que j'ai des données de panneau sur , et . Tout d'abord, j'utilise la différenciation intra-groupe pour supprimer l'hétérogénéité non observée, puis j'évalue les paramètres en utilisant l'approche de la fonction de contrôle comme si les données étaient des données transversales (voir ci-dessus). Dois-je faire des ajustements supplémentaires dans le cas où j'utilise des données de panneau par rapport au cas illustré ci-dessus?
la source