Corrélation croisée entre deux séries saisonnières

8

Pour déterminer la corrélation croisée entre Saleset Variable cost, les deux ayant une saisonnalité mensuelle, dois-je désaisonnaliser les deux séries?

tooshrit
la source

Réponses:

6

La question essentielle est, quel problème essayez-vous de résoudre?

Si vous avez l'intention de construire un bon modèle pour les données (et d'utiliser ensuite le modèle pour le test d'hypothèse, la prévision ou autre), vous devez tenir compte de tous les modèles existants. En cas de saisonnalité, vous devez inclure des modèles saisonniers dans votre modèle. Si vous ne le faites pas, le modèle pourrait ne pas être adéquat; cela pourrait donner des résultats de test d'hypothèse peu fiables, de mauvaises prévisions, etc.

Vous dites maintenant que vous voulez déterminer (que j'interpréterai comme estimation) la corrélation croisée entre deux séries. Je comprends que la corrélation croisée n'est que la corrélation régulière estimée pour différents décalages par rapport aux dérivations des deux séries. Pour l'intuition il suffit de considérer la corrélation régulière, ce que je ferai désormais. L'idée peut être transposée de façon transparente d'une corrélation régulière à une corrélation croisée.

Si vos deux séries chronologiques étaient bivariées , la corrélation d'échantillon correspondrait à une corrélation de population. Par conséquent, vous pourriez avoir une estimation ponctuelle significative, un intervalle de confiance, etc. Cependant, si au moins une des séries chronologiques n'est pas , la définition d'un équivalent de population de la corrélation d'échantillon devient difficile, et par la suite les estimations sont difficiles à interpréter. Il devient alors plus facile de spécifier un modèle pour vos données et de commencer à poser des questions en termes de modèle.i.i.d.i.i.d.

Supposons maintenant que les deux séries sont bivariées sauf pour les modèles saisonniers dans leurs moyennes. Ensuite, vous pouvez les supprimer et estimer la corrélation des séries désaisonnalisées (qui à ce stade devraient être à peu près bivariées ). Mais sachez que la corrélation que vous obtenez après la désaisonnalisation n'est pas informative de votre question initiale, "Quelle est la corrélation entre les deux séries?" Par exemple, vos deux séries peuvent avoir exactement le même modèle saisonnier et juste des variations aléatoires mineures autour d'elle. Ainsi, les deux séries sont presque les mêmes, et vous penseriez intuitivement que leur corrélation devrait être positive et vraiment élevée (proche de l'unité). Mais l'échantillon de corrélation que vous obtenez après la désaisonnalisationi.i.d.i.i.d.peut se situer entre [-1,1], car les composantes de bruit aléatoire (estimées, mais aussi véritables sous-jacentes) des deux séries peuvent ou non être corrélées. Vous obtiendriez ainsi une réponse à une question qui ne vous intéresse pas vraiment; il n'y a aucune garantie que la réponse soit proche de ce que vous recherchez réellement.

Par conséquent, je vous recommande de vous fier à un modèle entièrement spécifié (à moins que vos deux séries chronologiques ne soient bivariées ) et de poser des questions en termes de modèle. D'un autre côté, si vous n'avez pas le temps de construire un modèle et que vous avez besoin d'une réponse rapide (cela peut arriver), je pense que l'estimation ponctuelle la plus pertinente de la corrélation entre les deux séries ne serait que la corrélation d'échantillon régulière (même si il a le problème de ne pas avoir d'homologue significatif dans la population et son intervalle de confiance serait difficile à définir, comme expliqué plus haut).i.i.d.

Richard Hardy
la source
1

Si vous régressez deux séries chronologiques (non liées) avec la saisonnalité, vous pourriez obtenir ce que l'on appelle une corrélation fallacieuse . Un exemple de cela est disponible ici

"il est important d'examiner si des tendances significatives existent dans la série. Si nous ignorons une tendance commune, nous pouvons estimer une régression parasite, dans laquelle les variables et semblent être corrélées en raison de l'influence sur les deux d'un omis facteur, le passage du temps "- sourceyX

La tendance commune pourrait être une dérive ou un modèle de saisonnalité. Afin d'éviter une corrélation fallacieuse, il est essentiel de blanchir vos données, compensant l'effet de la tendance et de la saisonnalité. Vous pouvez ensuite régresser sur les résidus.

Une introduction plus formelle au problème est disponible ici

IcannotFixThis
la source
1
Beaucoup de bons points, mais j'ai quelques inquiétudes, en particulier si l'approche proposée résoudrait le vrai problème et répondrait à la bonne question. Vous pouvez trouver mon point de vue dans une autre réponse à cette question.
Richard Hardy
1

Le lien vers la "solution plus formelle" semble aller vers une page générique uni. Pourriez-vous le mettre à jour pour pointer vers l'article, s'il est toujours disponible?

Peter Ellis
la source