Utilisation des erreurs standard HAC bien qu'il puisse n'y avoir aucune autocorrélation

8

J'exécute quelques régressions et, comme je voulais être du bon côté, j'ai décidé d'utiliser des erreurs standard HAC (hétéroscédasticité et autocorrélation cohérentes) tout au long. Il peut y avoir quelques cas où la corrélation série n'est pas présente. Est-ce de toute façon une approche valable? Y a-t-il des inconvénients?

Juliett Bravo
la source
1
si vous utilisez HAC, bien qu'il n'y ait pas de corr. série, vous serez en sécurité, pas de soucis.
Math-fun
Merci pour la réponse rapide, c'est bon à entendre! Je viens de trouver ce fil ici qui est lié: stats.stackexchange.com/questions/144721/… Donc c'est sûr à utiliser mais il y a quelques pertes d'efficacité. Merci encore!
Juliett Bravo

Réponses:

9

En gros, lors de l'estimation des erreurs types:

  • Si vous supposez que quelque chose est vrai et que ce n'est pas vrai, vous perdez généralement de la cohérence. ( C'est mauvais. À mesure que le nombre d'observations augmente, votre estimation n'a pas besoin de converger en probabilité vers la vraie valeur.) Par exemple. lorsque vous supposez que les observations sont indépendantes et qu'elles ne le sont pas, vous pouvez sous-estimer massivement les erreurs standard.
  • Si vous ne supposez pas que quelque chose est vrai et que c'est vrai, vous perdez généralement une certaine efficacité (c'est-à-dire que votre estimateur est plus bruyant que nécessaire.) Ce n'est souvent pas une grosse affaire. Défendre votre travail en séminaire a tendance à être plus facile si vous avez été conservateur dans vos hypothèses.

Si vous avez suffisamment de données, vous devriez être en sécurité puisque l'estimateur est cohérent!

Comme Woolridge le fait remarquer dans son livre Introductory Econometrics (p.247 6e édition), un gros inconvénient peut provenir de petits problèmes d'échantillonnage, à savoir que vous pouvez effectivement supprimer une hypothèse (c.-à-d. Pas de corrélation sérielle des erreurs) mais ajouter une autre hypothèse que vous avez assez de données pour que le théorème de la limite centrale entre en action! HAC etc ... s'appuie sur des arguments asymptotiques.

Si vous avez trop peu de données pour vous fier à des résultats asymptotiques:

  • Les "statistiques t" que vous calculez peuvent ne pas suivre la distribution t pour les petits échantillons. Par conséquent, les valeurs de p peuvent être tout à fait fausses.
  • Mais si les erreurs sont vraiment des erreurs IID normales et homoskédastiques, les statistiques t que vous calculez, selon les hypothèses classiques de petit échantillon, suivront avec précision la distribution t.

Voir cette réponse ici à une question connexe: https://stats.stackexchange.com/a/5626/97925

Matthew Gunn
la source
6

En effet, il devrait y avoir une certaine perte d'efficacité dans les échantillons finis mais asymptotiquement, vous êtes du bon côté. Pour voir cela, considérons le cas simple d'estimation d'une moyenne d'échantillon (qui est un cas particulier d'une régression dans laquelle vous régressez uniquement sur une constante):

Les estimateurs HAC estiment l'erreur-type de la moyenne de l'échantillon. Supposons que soit une covariance stationnaire avec et tels que .OuitE(Ouit)=μCov(Ouit,Ouit-j)=γjj=0|γj|<

Ensuite, quelle estimation des erreurs standard HAC est la racine carrée de la "variance à long terme", donnée par: Maintenant, si la série n'a pas de corrélation sérielle, alors pour , que l'estimateur HAC "découvrira" aussi comme , de sorte qu'il se résumera à un estimateur de la racine carrée de la variance standard .

limT{Vuner[T(Oui¯T-μ)]}=limT{TE(Oui¯T-μ)2}=γ0+2j=1γj.
γj=0j>0Tγ0
Christoph Hanck
la source