Toujours signaler les erreurs standard robustes (blanches)?

20

Il a été suggéré par Angrist et Pischke que les erreurs-types robustes (c.-à-d. Robustes à l'hétéroscédasticité ou aux variations inégales) sont signalées d'office plutôt que de les tester. Deux questions:

  1. Quel est l'impact sur les erreurs standard de le faire en cas d'homoscédasticité?
  2. Quelqu'un le fait-il réellement dans son travail?
Graham Cookson
la source
Je ne suis pas sûr de ce que vous entendiez par "erreurs standard robustes sont signalées comme une évidence" erreurs standard de quoi? Vous avez dit tester pour "it" quel est le test dont vous parlez?
robin girard
1
Bon point .... Je parle des erreurs standard des coefficients de régression dans la régression OLS et du problème de l'hétéroscédasticité. L'approche traditionnelle serait de tester la présence d'hétéroscédasticité en utilisant, par exemple, le test de White ou le test de Breusch Pagan. Si une hétéroscédasticité est trouvée, alors on rapportera des erreurs standard robustes, généralement des erreurs standard blanches.
Graham Cookson
Souhaitez-vous mettre un lien vers Angrist et Pischke.
csgillespie
1
Angrist, Joshua D. et Jorn-Steffen Pischke. 2009. Economies principalement inoffensives: le compagnon d'un empiriste. Princeton University Press: Princeton, NJ.
Charlie

Réponses:

10

L'utilisation d'erreurs standard robustes est devenue une pratique courante en économie. Les erreurs standard robustes sont généralement plus importantes que les erreurs standard non robustes (standard?), De sorte que la pratique peut être considérée comme un effort de prudence.

Dans les grands échantillons ( par exemple, si vous travaillez avec des données de recensement avec des millions d'observations ou des ensembles de données avec "seulement" des milliers d'observations), les tests d'hétéroscédasticité se révéleront presque sûrement positifs, donc cette approche est appropriée.

Un autre moyen de lutter contre l'hétéroscédasticité est la pondération des moindres carrés, mais cette approche est devenue négligée car elle modifie les estimations des paramètres, contrairement à l'utilisation d'erreurs standard robustes. Si vos pondérations sont incorrectes, vos estimations sont biaisées. Cependant, si vos pondérations sont correctes, vous obtenez des erreurs standard plus petites ("plus efficaces") que OLS avec des erreurs standard robustes.

Charlie
la source
1
Dans quelle mesure les erreurs standard robustes sont-elles plus larges que les erreurs standard régulières lorsque les hypothèses OLS ne sont pas violées?
russellpierce
1
Pas toujours plus larges du tout - en fait, elles peuvent parfois être plus étroites. Voir le dernier article sur le blog du livre d'Angrist & Pischke: mostharmlesseconometrics.com/2010/12/…
onestop
1
+1, avec la mise en garde de @ onestop dans le commentaire ci-dessus que les se robustes pourraient très bien être plus grands ou plus petits, bien que nous nous attendions généralement à ce qu'ils soient plus grands et donc "conservateurs" par rapport à une erreur de type I. Et oui, j'utilise toujours des éléments robustes hétéroscédastiques ou robustes en cluster dans mon travail, comme tout le monde que je connais.
Cyrus S
1
Les tests d'hétéroskédasticité qui ne se révèlent pas significatifs ne sont pas une raison pour cesser de s'inquiéter de l'hétéroskédasticité ruinant votre OLS - ce test peut ne pas avoir beaucoup de pouvoir, même si l'effet est là.
invité
1
Une bonne raison de ne pas essayer le WLS est que, très souvent, vous n'avez aucune idée de la véritable relation moyenne-variance - et jeter un œil aux données à choisir peut invalider votre inférence freqentiste. Comme Cyrus, j'utilise des se robustes partout.
invité
6

Dans l' économétrie introductive (Woolridge, édition 2009 page 268), cette question est abordée. Woolridge dit que lors de l'utilisation d'erreurs standard robustes, les statistiques t obtenues n'ont que des distributions similaires aux distributions t exactes si la taille de l'échantillon est grande. Si la taille de l'échantillon est petite, les statistiques t obtenues à l'aide d'une régression robuste peuvent avoir des distributions qui ne sont pas proches de la distribution t, ce qui peut fausser l'inférence.


la source
6

Des erreurs standard robustes fournissent des estimations d'erreurs standard non biaisées sous hétéroscédasticité. Il existe plusieurs manuels statistiques qui fournissent une discussion longue et approfondie sur les erreurs types robustes. Le site suivant fournit un résumé assez complet des erreurs standard robustes:

https://economictheoryblog.com/2016/08/07/robust-standard-errors/

Revenons à vos questions. L'utilisation d'erreurs standard robustes n'est pas sans réserves. Selon Woolridge (édition 2009, page 268) utilisant des erreurs standard robustes, les statistiques t obtenues n'ont que des distributions similaires aux distributions t exactes si la taille de l'échantillon est grande. Si la taille de l'échantillon est petite, les statistiques t obtenues à l'aide d'une régression robuste peuvent avoir des distributions qui ne sont pas proches de la distribution t. Cela pourrait annuler l'inférence. De plus, en cas d'homoscédasticité, les erreurs types robustes sont toujours non biaisées. Cependant, ils ne sont pas efficaces. C'est-à-dire que les erreurs standard conventionnelles sont plus précises que les erreurs standard robustes. Enfin, l'utilisation d'erreurs standard robustes est une pratique courante dans de nombreux domaines universitaires.

Flavian Barton
la source
5

Il existe de nombreuses raisons d'éviter d'utiliser des erreurs standard robustes. Techniquement, ce qui se passe, c'est que les écarts sont pondérés par des poids que vous ne pouvez pas prouver en réalité. Ainsi, la rugosité n'est qu'un outil cosmétique. En général, vous devriez réfléchir à la modification du modèle. Il y a beaucoup d'implications pour mieux gérer l'hétérogénéité que de simplement peindre le problème qui se produit à partir de vos données. Prenez-le comme un signe pour changer de modèle. La question est étroitement liée à la question de savoir comment traiter les valeurs aberrantes. Certaines personnes les suppriment simplement pour obtenir de meilleurs résultats, c'est presque la même chose lors de l'utilisation d'erreurs standard robustes, juste dans un autre contexte.

MarkDollar
la source
C'est vraiment un mauvais conseil, utilisez toujours des erreurs robustes car elles sont cohérentes dans les deux cas
Repmat
3

Je pensais que l'erreur standard blanche et l'erreur standard calculées de la manière "normale" (par exemple, la Hesse et / ou l'OPG dans le cas de la probabilité maximale) étaient asymptotiquement équivalentes dans le cas de l'homoscédasticité?

Ce n'est qu'en cas d'hétéroscédasticité que l'erreur standard "normale" sera inappropriée, ce qui signifie que l'erreur standard blanche est appropriée avec ou sans hétéroskédasticité, c'est-à-dire même lorsque votre modèle est homoskédastique.

Je ne peux pas vraiment parler de 2, mais je ne vois pas pourquoi on ne voudrait pas calculer le SE Blanc et l'inclure dans les résultats.

Vivi
la source
2

J'ai un manuel intitulé Introduction to Econometrics, 3rd ed. par Stock et Watson qui se lit comme suit: "si les erreurs sont hétéroscédastiques, alors la statistique t calculée en utilisant l'erreur standard d'homoscédasticité uniquement n'a pas de distribution normale standard, même dans de grands échantillons." Je crois que vous ne pouvez pas faire de tests d'inférence / d'hypothèse appropriés sans être en mesure de supposer que votre statistique t est distribuée normalement. J'ai BEAUCOUP de respect pour Wooldridge (en fait, ma classe de deuxième cycle a également utilisé son livre), donc je crois que ce qu'il dit sur les statistiques t utilisant des SE robustes nécessite de grands échantillons pour être approprié est certainement correct, mais je pense que nous doivent souvent faire face à l'exigence d'un grand échantillon, et nous l'acceptons. Cependant, le fait que l'utilisation de SE non robustes ne donnera pas de t-stat avec la distribution normale standard appropriéemême si vous avez un grand échantillon, cela crée un défi beaucoup plus important à surmonter.

Stacey
la source