Il a été suggéré par Angrist et Pischke que les erreurs-types robustes (c.-à-d. Robustes à l'hétéroscédasticité ou aux variations inégales) sont signalées d'office plutôt que de les tester. Deux questions:
- Quel est l'impact sur les erreurs standard de le faire en cas d'homoscédasticité?
- Quelqu'un le fait-il réellement dans son travail?
regression
standard-error
heteroscedasticity
robust-standard-error
Graham Cookson
la source
la source
Réponses:
L'utilisation d'erreurs standard robustes est devenue une pratique courante en économie. Les erreurs standard robustes sont généralement plus importantes que les erreurs standard non robustes (standard?), De sorte que la pratique peut être considérée comme un effort de prudence.
Dans les grands échantillons ( par exemple, si vous travaillez avec des données de recensement avec des millions d'observations ou des ensembles de données avec "seulement" des milliers d'observations), les tests d'hétéroscédasticité se révéleront presque sûrement positifs, donc cette approche est appropriée.
Un autre moyen de lutter contre l'hétéroscédasticité est la pondération des moindres carrés, mais cette approche est devenue négligée car elle modifie les estimations des paramètres, contrairement à l'utilisation d'erreurs standard robustes. Si vos pondérations sont incorrectes, vos estimations sont biaisées. Cependant, si vos pondérations sont correctes, vous obtenez des erreurs standard plus petites ("plus efficaces") que OLS avec des erreurs standard robustes.
la source
Dans l' économétrie introductive (Woolridge, édition 2009 page 268), cette question est abordée. Woolridge dit que lors de l'utilisation d'erreurs standard robustes, les statistiques t obtenues n'ont que des distributions similaires aux distributions t exactes si la taille de l'échantillon est grande. Si la taille de l'échantillon est petite, les statistiques t obtenues à l'aide d'une régression robuste peuvent avoir des distributions qui ne sont pas proches de la distribution t, ce qui peut fausser l'inférence.
la source
Des erreurs standard robustes fournissent des estimations d'erreurs standard non biaisées sous hétéroscédasticité. Il existe plusieurs manuels statistiques qui fournissent une discussion longue et approfondie sur les erreurs types robustes. Le site suivant fournit un résumé assez complet des erreurs standard robustes:
https://economictheoryblog.com/2016/08/07/robust-standard-errors/
Revenons à vos questions. L'utilisation d'erreurs standard robustes n'est pas sans réserves. Selon Woolridge (édition 2009, page 268) utilisant des erreurs standard robustes, les statistiques t obtenues n'ont que des distributions similaires aux distributions t exactes si la taille de l'échantillon est grande. Si la taille de l'échantillon est petite, les statistiques t obtenues à l'aide d'une régression robuste peuvent avoir des distributions qui ne sont pas proches de la distribution t. Cela pourrait annuler l'inférence. De plus, en cas d'homoscédasticité, les erreurs types robustes sont toujours non biaisées. Cependant, ils ne sont pas efficaces. C'est-à-dire que les erreurs standard conventionnelles sont plus précises que les erreurs standard robustes. Enfin, l'utilisation d'erreurs standard robustes est une pratique courante dans de nombreux domaines universitaires.
la source
Il existe de nombreuses raisons d'éviter d'utiliser des erreurs standard robustes. Techniquement, ce qui se passe, c'est que les écarts sont pondérés par des poids que vous ne pouvez pas prouver en réalité. Ainsi, la rugosité n'est qu'un outil cosmétique. En général, vous devriez réfléchir à la modification du modèle. Il y a beaucoup d'implications pour mieux gérer l'hétérogénéité que de simplement peindre le problème qui se produit à partir de vos données. Prenez-le comme un signe pour changer de modèle. La question est étroitement liée à la question de savoir comment traiter les valeurs aberrantes. Certaines personnes les suppriment simplement pour obtenir de meilleurs résultats, c'est presque la même chose lors de l'utilisation d'erreurs standard robustes, juste dans un autre contexte.
la source
Je pensais que l'erreur standard blanche et l'erreur standard calculées de la manière "normale" (par exemple, la Hesse et / ou l'OPG dans le cas de la probabilité maximale) étaient asymptotiquement équivalentes dans le cas de l'homoscédasticité?
Ce n'est qu'en cas d'hétéroscédasticité que l'erreur standard "normale" sera inappropriée, ce qui signifie que l'erreur standard blanche est appropriée avec ou sans hétéroskédasticité, c'est-à-dire même lorsque votre modèle est homoskédastique.
Je ne peux pas vraiment parler de 2, mais je ne vois pas pourquoi on ne voudrait pas calculer le SE Blanc et l'inclure dans les résultats.
la source
J'ai un manuel intitulé Introduction to Econometrics, 3rd ed. par Stock et Watson qui se lit comme suit: "si les erreurs sont hétéroscédastiques, alors la statistique t calculée en utilisant l'erreur standard d'homoscédasticité uniquement n'a pas de distribution normale standard, même dans de grands échantillons." Je crois que vous ne pouvez pas faire de tests d'inférence / d'hypothèse appropriés sans être en mesure de supposer que votre statistique t est distribuée normalement. J'ai BEAUCOUP de respect pour Wooldridge (en fait, ma classe de deuxième cycle a également utilisé son livre), donc je crois que ce qu'il dit sur les statistiques t utilisant des SE robustes nécessite de grands échantillons pour être approprié est certainement correct, mais je pense que nous doivent souvent faire face à l'exigence d'un grand échantillon, et nous l'acceptons. Cependant, le fait que l'utilisation de SE non robustes ne donnera pas de t-stat avec la distribution normale standard appropriéemême si vous avez un grand échantillon, cela crée un défi beaucoup plus important à surmonter.
la source