La "régression parasite" (dans le contexte des séries chronologiques) et les termes associés comme les tests de racine unitaire sont quelque chose dont j'ai beaucoup entendu parler, mais que je n'ai jamais compris.
Pourquoi / quand, intuitivement, cela se produit-il? (Je crois que c'est lorsque vos deux séries chronologiques sont cointégrées, c'est-à-dire qu'une combinaison linéaire des deux est stationnaire, mais je ne vois pas pourquoi la cointégration devrait conduire à la falsification.) Que faites-vous pour l'éviter?
Je cherche une compréhension de haut niveau de ce que la cointégration / tests de racine unitaire / causalité de Granger ont à voir avec la régression parasite (ces trois termes sont des termes dont je me souviens avoir été associé à une régression parasite d'une manière ou d'une autre, mais je ne me souviens pas exactement de quoi), Donc, soit une réponse personnalisée ou un lien vers des références où je peux en savoir plus serait formidable.
la source
Commençons par la régression parasite. Prenez ou imaginez deux séries qui sont toutes deux motivées par une tendance temporelle dominante: par exemple la population américaine et la consommation américaine de quoi que ce soit (peu importe à quoi vous pensez, que ce soit du soda, de la réglisse ou du gaz). Les deux séries vont croître en raison de la tendance temporelle commune. Maintenant régresser la consommation agrégée sur la taille de la population agrégée et hop, vous avez un bon ajustement. (Nous pourrions également simuler cela rapidement dans R.)
Mais ça ne veut rien dire. Il n'y a pas de relation (comme nous le savons comme les modélisateurs) - mais le modèle linéaire voit un ajustement (dans le sens de la somme des carrés minimisante) car les deux séries se trouvent toutes les deux à la hausse sans lien de causalité. Nous avons été victimes d'une fausse régression.
Ce qui pourrait ou devrait être modélisé, c'est le changement d'une série sur le changement dans l'autre, ou peut-être la consommation par habitant, ou ... Tous ces changements rendent les variables stationnaires, ce qui contribue à atténuer le problème.
Maintenant, à partir de 30000 pieds, les racines unitaires et la cointégration vous aident à déduire formellement dans ces cas en fournissant un fondement statistique rigoureux (les publications Econometrica et un Nobel ne viennent pas facilement) là où aucun n'était disponible.
Quant à la question dans les bonnes ressources: c'est délicat. J'ai lu des dizaines de livres de séries chronologiques, et la plupart excellent en mathématiques et laisse l'intuition derrière moi. Il n'y a rien de tel que le texte de Kennedy Econometrics pour les séries chronologiques. Peut-être que le texte de Walter Enders est le plus proche. J'essaierai d'y penser et de mettre à jour ici.
À part les livres, les logiciels pour le faire sont importants et R a ce dont vous avez besoin. Le prix est juste aussi.
la source
Une série aurait une racine unitaire si elle n'est pas stationnaire. Lorsque vous avez, disons, deux processus non stationnaires intégrés à l'ordre 1 (série I (1)) et que vous pouvez trouver une combinaison linéaire de ces processus qui est I (0), alors vos séries sont cointégrées. Cela signifie qu'ils évoluent d'une manière quelque peu similaire. Cette chaîne a de belles idées sur les séries chronologiques, la cointégration et donc https://www.youtube.com/watch?v=vvTKjm94Ars Quant aux livres, j'aime beaucoup "Théorie et méthodes économétriques" de Davidson & MacKinnon.
la source