Comparaison entre Newey-West (1987) et Hansen-Hodrick (1980)

15

Question: Quelles sont les principales différences et similitudes entre l'utilisation des erreurs types de Newey-West (1987) et de Hansen-Hodrick (1980)? Dans quelles situations faut-il privilégier l’un d’eux?

Remarques:

  • Je sais comment fonctionne chacune de ces procédures d'ajustement; cependant, je n'ai pas encore trouvé de document qui les comparerait, en ligne ou dans mon manuel. Les références sont les bienvenues!
  • Newey-West a tendance à être utilisé comme des erreurs standard HAC «fourre-tout», tandis que Hansen-Hodrick revient fréquemment dans le contexte de points de données qui se chevauchent (par exemple, voir cette question ou cette question ). Par conséquent, un aspect important de ma question est: y a-t-il quelque chose à propos de Hansen-Hodrick qui le rende plus adapté pour traiter des données qui se chevauchent que Newey-West? (Après tout, le chevauchement des données conduit finalement à des termes d'erreur corrélés en série, ce que Newey-West traite également.)
  • Pour mémoire, je suis au courant de cette question similaire , mais elle a été relativement mal posée, a été déclassée et finalement la question que je pose ici n'a pas reçu de réponse (seule la partie liée à la programmation a obtenu une réponse).
Candamir
la source
4
Les estimateurs HAC de type NW ne sont-ils pas remplacés par les estimateurs HAC à lissage fixe de Kiefer & Vogelsang (2002) et de la littérature ultérieure?
tchakravarty
2
En particulier, vous voudrez peut-être lire les articles d'opinion de Frank Diebold ici et ici .
tchakravarty
1
@tchakravarty C'est une pensée intéressante, merci pour le partage! Je vais devoir revenir un peu en arrière et regarder d'abord Kiefer, Vogelsang et Bunzel (2000) . Si vous souhaitez développer votre argument dans une réponse, en expliquant également ce que cela implique pour les estimateurs de type Hansen-Hodrick qui traitent des données qui se chevauchent, vous auriez de très bonnes chances d'obtenir la prime. (Il ne serait pas honnête de ma part de le garantir, évidemment, car quelqu'un d'autre pourrait écrire une réponse concurrente, mais jusqu'à présent, ma prime n'a pas été très populaire.)
Candamir
2
@tchakravarty, la littérature théorique semble s'y arrêter, mais en pratique, ces estimateurs ne sont pas encore largement utilisés, je dirais.
Christoph Hanck

Réponses:

8

Considérons une classe d'estimateurs de variance à long terme

kest une fonction de pondération ou noyau, la γ

JT^γ^0+2j=1T1k(jT)γ^j
k sontexemplesautocovariances. k , entre autres, doit être symétrique et avoir k ( 0 ) = 1 . T est un paramètre de bande passante.γ^jkk(0)=1T

Newey & West (Econometrica 1987) proposent le noyau de Bartlett

k(jT)={(1jT)for0jT10forj>T1

L' estimateur de Hansen & Hodrick (Journal of Political Economy 1980) revient à prendre un kernal tronqué, c'est-à-dire pour j M pour certains M , et k = 0 sinon. Comme l'estime Newey & West, cet estimateur est cohérent, mais n'est pas garanti positif semi-défini (lors de l'estimation des matrices), tandis que l'estimateur du noyau de Newey & West l'est.k=1jMMk=0

Essayez pour un processus MA (1) avec un coefficient θ fortement négatif . La quantité de population est connue pour être J = σ 2 ( 1 + θ ) 2 > 0 , mais l'estimateur de Hansen-Hodrick peut ne pas être: M=1θJ=σ2(1+θ)2>0

set.seed(2)
y <- arima.sim(model = list(ma = -0.95), n = 10)
acf.MA1 <- acf(y, type = "covariance", plot = FALSE)$acf
acf.MA1[1] + 2 * acf.MA1[2]
## [1] -0.4056092

ce qui n'est pas une estimation convaincante d'une variance à long terme .

Cela serait évité avec l'estimateur de Newey-West:

acf.MA1[1] + acf.MA1[2]
## [1] 0.8634806

En utilisant le sandwichpackage, cela peut également être calculé comme:

library("sandwich")
m <- lm(y ~ 1)
kernHAC(m, kernel = "Bartlett", bw = 2,
  prewhite = FALSE, adjust = FALSE, sandwich = FALSE)
##             (Intercept)
## (Intercept)   0.8634806

Et l'estimation de Hansen-Hodrick peut être obtenue comme:

kernHAC(m, kernel = "Truncated", bw = 1,
  prewhite = FALSE, adjust = FALSE, sandwich = FALSE)    
##             (Intercept)
## (Intercept)  -0.4056092

Voir aussi NeweyWest()et à lrvar()partir de sandwichpour des interfaces de commodité pour obtenir des estimateurs de Newey-West de modèles linéaires et de variances à long terme de séries chronologiques, respectivement.

Andrews (Econometrica 1991) fournit une analyse dans des conditions plus générales.

Quant à votre sous-question concernant les données qui se chevauchent, je ne serais pas au courant d'une raison de l'objet. Je soupçonne que la tradition est à l'origine de cette pratique courante.

Christoph Hanck
la source
J'apprécie votre réponse, mais je ne serai probablement en mesure de réviser et j'espère que d'accepter au cours du week-end. Merci encore.
Candamir
1
Merci encore pour votre réponse. Juste pour clarifier, votre réponse dit en effet que Newey-West devrait être préféré à Hansen-Hodrick dans tous les cas, car ce dernier pourrait "mal se comporter", ce qui "interfère avec la formation d'un intervalle de confiance asymptotique et les tests d'hypothèse" (les deux citations de Newey- West, 1987)?
Candamir
PS. Pourriez-vous également préciser la source de "Andrews"?
Candamir
1
J'ai lié les papiers à Jstor. En ce qui concerne les commentaires précédents, en effet, lorsqu'une estimation de la variance n'est même pas garantie d'être positive, nous ne devrions pas non plus nous attendre à ce qu'elle soit un bon ingrédient dans les intervalles de confiance et les statistiques de test.
Christoph Hanck