Ressources pour en savoir plus sur la régression de séries chronologiques parasites

10

La "régression parasite" (dans le contexte des séries chronologiques) et les termes associés comme les tests de racine unitaire sont quelque chose dont j'ai beaucoup entendu parler, mais que je n'ai jamais compris.

Pourquoi / quand, intuitivement, cela se produit-il? (Je crois que c'est lorsque vos deux séries chronologiques sont cointégrées, c'est-à-dire qu'une combinaison linéaire des deux est stationnaire, mais je ne vois pas pourquoi la cointégration devrait conduire à la falsification.) Que faites-vous pour l'éviter?

Je cherche une compréhension de haut niveau de ce que la cointégration / tests de racine unitaire / causalité de Granger ont à voir avec la régression parasite (ces trois termes sont des termes dont je me souviens avoir été associé à une régression parasite d'une manière ou d'une autre, mais je ne me souviens pas exactement de quoi), Donc, soit une réponse personnalisée ou un lien vers des références où je peux en savoir plus serait formidable.

raegtin
la source

Réponses:

11

Ces concepts ont été créés pour traiter des régressions (par exemple la corrélation) entre des séries non stationnaires.

Clive Granger est l'auteur clé que vous devriez lire.

La cointégration a été introduite en 2 étapes:

1 / Granger, C. et P. Newbold (1974): «Spurious Regression in Econometrics»,

Dans cet article, les auteurs soulignent que la régression parmi les variables non stationnaires doit être effectuée en tant que régressions parmi les changements (ou log changements) des variables. Sinon, vous pourriez trouver une corrélation élevée sans aucune signification réelle. (= régression parasite)

2 / Engle, Robert F., Granger, Clive WJ (1987) "Co-intégration et correction d'erreurs: représentation, estimation et tests", Econometrica, 55 (2), 251-276.

Dans cet article (pour lequel Granger a été récompensé par le jury Nobel en 2003), les auteurs vont plus loin et introduisent la cointégration comme moyen d'étudier le modèle de correction d'erreur pouvant exister entre deux variables non stationnaires.
Fondamentalement, le conseil de 1974 de régresser le changement dans la série chronologique peut conduire à des modèles de régression non spécifiés. Vous pouvez en effet avoir des variables dont les changements ne sont pas corrélés, mais qui sont connectées via un "modèle de correction d'erreur".

Par conséquent, vous pouvez avoir une corrélation sans cointégration et une cointégration sans corrélation. Les deux sont complémentaires.

S'il n'y avait qu'un seul article à lire, je vous suggère de commencer par celui-ci, qui est une très bonne et agréable introduction:

(Murray 1993) Ivre et son chien

RockScience
la source
Engle et Granger ont reçu le même prix ensemble. Je doute que le jury Nobel ait spécifiquement exclu la contribution d'Engle à l'analyse de la cointégration, il serait donc prudent de dire que l'article les a aidés tous les deux (pas seulement Granger) à obtenir le prix.
Richard Hardy
12

Commençons par la régression parasite. Prenez ou imaginez deux séries qui sont toutes deux motivées par une tendance temporelle dominante: par exemple la population américaine et la consommation américaine de quoi que ce soit (peu importe à quoi vous pensez, que ce soit du soda, de la réglisse ou du gaz). Les deux séries vont croître en raison de la tendance temporelle commune. Maintenant régresser la consommation agrégée sur la taille de la population agrégée et hop, vous avez un bon ajustement. (Nous pourrions également simuler cela rapidement dans R.)

Mais ça ne veut rien dire. Il n'y a pas de relation (comme nous le savons comme les modélisateurs) - mais le modèle linéaire voit un ajustement (dans le sens de la somme des carrés minimisante) car les deux séries se trouvent toutes les deux à la hausse sans lien de causalité. Nous avons été victimes d'une fausse régression.

Ce qui pourrait ou devrait être modélisé, c'est le changement d'une série sur le changement dans l'autre, ou peut-être la consommation par habitant, ou ... Tous ces changements rendent les variables stationnaires, ce qui contribue à atténuer le problème.

Maintenant, à partir de 30000 pieds, les racines unitaires et la cointégration vous aident à déduire formellement dans ces cas en fournissant un fondement statistique rigoureux (les publications Econometrica et un Nobel ne viennent pas facilement) là où aucun n'était disponible.

Quant à la question dans les bonnes ressources: c'est délicat. J'ai lu des dizaines de livres de séries chronologiques, et la plupart excellent en mathématiques et laisse l'intuition derrière moi. Il n'y a rien de tel que le texte de Kennedy Econometrics pour les séries chronologiques. Peut-être que le texte de Walter Enders est le plus proche. J'essaierai d'y penser et de mettre à jour ici.

À part les livres, les logiciels pour le faire sont importants et R a ce dont vous avez besoin. Le prix est juste aussi.

Dirk Eddelbuettel
la source
0

Une série aurait une racine unitaire si elle n'est pas stationnaire. Lorsque vous avez, disons, deux processus non stationnaires intégrés à l'ordre 1 (série I (1)) et que vous pouvez trouver une combinaison linéaire de ces processus qui est I (0), alors vos séries sont cointégrées. Cela signifie qu'ils évoluent d'une manière quelque peu similaire. Cette chaîne a de belles idées sur les séries chronologiques, la cointégration et donc https://www.youtube.com/watch?v=vvTKjm94Ars Quant aux livres, j'aime beaucoup "Théorie et méthodes économétriques" de Davidson & MacKinnon.

arroba
la source
1
Merci d'avoir offert une réponse. Je n'y vois cependant rien qui réponde à la question de la fausse régression. Pourriez-vous élaborer sur la connexion?
whuber
"Je recherche une compréhension de haut niveau de ce que la cointégration / les tests de racine unitaire / la causalité de Granger ont à voir avec la régression parasite (...) donc une réponse personnalisée ou un lien vers des références où je peux en savoir plus serait formidable . " J'étudie également la régression parasite en ce moment, et je crois que les réponses données ci-dessus sont meilleures que ce que je peux offrir. Cependant, je pensais que partager des références qui m'avaient aidé pourrait être intéressant ...
arroba