vcovHC, vcovHAC, NeweyWest - quelle fonction utiliser?

10

J'essaie de mettre à jour mon modèle basé sur lm () pour obtenir des erreurs et des tests standard corrects. Je suis vraiment confus quant à la matrice VC à utiliser. Le sandwichpackage propose vcovHC, vcovHACet NeweyWest. Alors que le premier ne rend compte que de l'hétéroscédasticité, les deux derniers représentent à la fois la corrélation en série et l'hétéroskédasticité. Pourtant, la documentation ne dit pas grand-chose sur la différence entre les deux derniers (au moins je ne comprends pas). En regardant la fonction elle-même, j'ai réalisé que NeweyWest appelle en fait vcovHAC.

Empiriquement, les résultats coeftest(mymodel, vcov. = vcovHAC)et coeftest(mymodel, vcov. = NeweyWest)sont complètement différents. Bien qu'il vcovHACsoit quelque peu proche des résultats naïfs de lm, en utilisant NeweyWest, tous les coefficients deviennent insignifiants (tests même proches de 1).

hans0l0
la source
Habituellement, les pages d'aide R donnent un lien vers les articles. Les détails précis y résident généralement. L'article Zeileis par exemple est disponible gratuitement et contient une mine d'informations.
mpiktas
2
L'article de Zeileis indique spécifiquement en quoi vcovHACest différent de NeweyWest. Pour résumer, les différentes méthodes HAC ne diffèrent que par le choix des poids. NeweyWesta ses poids spécifiés, vcovHACest une fonction générale, qui vous permet de fournir vos propres poids et utilise par défaut les poids Andrews.
mpiktas
@mpiktas: thx pour le résumé. Comme je n'ai spécifié aucun poids, les poids par défaut respectifs doivent être utilisés. Maintenant que je sais, je devrais peut-être reformuler ma question: pourquoi les différents poids par défaut de vcovHAC et de NeweyWest font-ils une énorme différence et comment déterminer les poids? Je veux dire, savez-vous quels poids STATA ou autres packages utilisent?
hans0l0
tous ces calculs dépendent du fait que sont des variables stationnaires, où x t sont les régresseurs et u t sont les perturbations. La stationnarité est une propriété un peu restrictive, alors vérifiez si elle tient. XtutXtut
mpiktas

Réponses:

3

Le "sandwich" en question est deux morceaux de pain définis par les informations attendues enfermant une viande définie par les informations observées. Voir mes commentaires ici et ici . Pour une régression linéaire, l'équation d'estimation est:

U(β)=XT(Oui-XTβ)

Les informations attendues (pain) sont:

UNE=U(β)β=-(XTX)

Les informations observées (viande) sont:

B=E(U(β)U(β)T)=XT(Oui-XTβ)(Oui-XTβ)TX

UNE-1BUNE-1σ2(XTX)-1σ2n×n

R=(Oui-XTβ)(Oui-XTβ)

vcovHCR

Rjeje=(Ouije-βXje.)2,0 autre part

Cet estimateur fonctionne très bien sauf sous de petits échantillons (<40 est souvent supposé). Les HC1-3 sont diverses corrections d'échantillons finis. HC3 est généralement le plus performant.

Tgeegeeà la place en spécifiant la structure de covariance AR-1ou similaire.

Quant à l'utilisation, elle dépend de la nature de l'analyse des données et de la question scientifique. Je ne conseillerais pas de monter tous les types et de choisir celui qui semble le mieux, car il s'agit d'un problème de test multiple. Comme je l'ai mentionné précédemment, l'estimateur vcovHC est cohérent même en présence d'un effet autorégressif, vous pouvez donc utiliser et justifier un «modèle de corrélation d'indépendance de travail» dans diverses circonstances.

AdamO
la source