Corrélation entre deux séries chronologiques

24

Quelle est la méthode / méthode la plus simple pour calculer la corrélation entre deux séries chronologiques qui ont exactement la même taille? J'ai pensé multiplier et , et additionner la multiplication. Donc, si ce nombre unique était positif, peut-on dire que ces deux séries sont corrélées? Je peux penser à quelques exemples cependant où une autre série temporelle à croissance exponentielle linéaire n'aurait aucune relation entre elles, mais le calcul ci-dessus rapporterait qu'elles étaient corrélées.(X[t]-μX)(y[t]-μy)

Des pensées?

BBDynSys
la source
3
Avez-vous déjà entendu parler de la fonction de corrélation croisée - en.wikipedia.org/wiki/Cross-correlation#Time_series_analysis ?
Macro
Vos deux séries chronologiques ont exactement la même taille. Voir stats.stackexchange.com/questions/3463/… car il est similaire, pas tout à fait identique à votre question, avec deux séries de même taille et fréquence, bien qu'elles ne soient pas stationnaires.
Ellie Kesselman

Réponses:

11

Le point de macro est correct la bonne façon de comparer les relations entre les séries temporelles est par la fonction de corrélation croisée (en supposant la stationnarité). Avoir la même longueur n'est pas indispensable. La corrélation croisée au décalage 0 calcule simplement une corrélation comme faire l'estimation de corrélation de Pearson appariant les données aux points de temps identiques. S'ils ont la même longueur que vous supposez, vous aurez des paires T exactes où T est le nombre de points de temps pour chaque série. La corrélation croisée Lag 1 correspond au temps t de la série 1 avec le temps t + 1 de la série 2. Notez qu'ici même si les séries sont de la même longueur, vous n'avez qu'une paire T-2 car un point de la première série n'a pas de correspondance dans la seconde et un autre point de la deuxième série n'aura pas de correspondance avec la première. Compte tenu de ces deux séries, vous pouvez estimer la corrélation croisée à plusieurs décalages. Si l'une des corrélations croisées est statistiquement significativement différente de 0, cela indiquera une corrélation entre les deux séries.

Michael R. Chernick
la source
Salut Michael, est-il possible de quantifier "significativement différent" - puis-je utiliser un écart type de 1 ou 2 loin de zéro comme significatif?
BBDynSys
@ user423805 Je l'ai changé pour lire statistiquement significativement différent de 0. Formellement, cela signifie que vous testez l'hypothèse nulle que la corrélation est nulle par rapport à l'alternative qu'elle n'est pas 0. Ensuite, calculez la valeur p bilatérale pour la statistique de test . Généralement, la signification statistique signifie une valeur p <= 0,05. Parfois, d'autres valeurs sont utilisées pour définir la signification statistique (0,01 par exemple). La plupart des progiciels de séries chronologiques qui incluent plusieurs séries chronologiques peuvent effectuer ces tests pour vous. Notre ami IrishStat peut en parler à propos d'Autobox.
Michael R. Chernick
y a-t-il des cas dans lesquels la corrélation croisée à décalage zéro et Pearson diffèrent?
Bakaburg, le
4

Vous voudrez peut-être regarder une question similaire et ma réponse Corréler la série temporelle du volume qui suggère que vous pouvez calculer les corrélations croisées MAIS les tester est un cheval d'une couleur différente (un équidé d'une teinte différente) en raison de la structure autorégressive ou déterministe de l'un ou l'autre séries.

IrishStat
la source
si je comprends bien, dans cette réponse, vous dites que la corrélation croisée entre séries temporelles est inutile.
BBDynSys
user423805 PEUT être inutile à moins que les données ne soient convenablement pré-filtrées pour obtenir l'IID Cela répond directement aux préoccupations réelles du PO concernant les conclusions fallacieuses comme "les cigognes amenant des bébés J. Neyman 1938 en.wikipedia.org/wiki/… et amstat.org/about / statisticiansinhistory /… "etc (je peux penser à quelques exemples cependant où une autre série chronologique à croissance exponentielle linéaire n'aurait aucun rapport les uns avec les autres, mais le calcul ci-dessus rapporterait qu'ils étaient corrélés.)
IrishStat
Je pense que le fait est que la série doit être stationnaire pour que les corrélations croisées aient un sens. Si le filtrage est nécessaire, c'est pour supprimer la série stationnaire (comme la différenciation ou la différenciation saisonnière). Mais l'appeler inutile est faux.
Michael R. Chernick,
@Michael, j'ai dit PEUT être inutile.
IrishStat
@IrishStat Ce fut un bon commentaire et m'a ramené à ma formation dans les années 1970. À cette époque, j'apprenais les séries chronologiques / les méthodes de prévision pour mon travail civil dans l'armée américaine. Nous utilisions le lissage exponentiel comme moyen de prévision basé sur des données historiques sur des estimations subjectives qui étaient utilisées dans les dépôts d'approvisionnement. Quelqu'un m'a fait la grande suggestion de regarder les modèles ARIMA plus généraux et le texte de 1970 de Box et Jenkins et a donc commencé mon intérêt pour les séries chronologiques qui sont devenues une partie de ma carrière.
Michael R. Chernick
-1

Il y a des trucs intéressants ici

/programming/3949226/calculating-pearson-correlation-and-significance-in-python

C'était en fait ce dont j'avais besoin. Simple à mettre en œuvre et à expliquer.

BBDynSys
la source
2
-1 D'après ce que je peux comprendre, ces réponses ne concernent que la corrélation produit-moment standard de Pearson. Appliquée à deux séries chronologiques, la corrélation standard de Pearson donne des résultats absurdes! Si vous suivez ces suggestions, tout ce que vous faites est de produire des artefacts statistiques. Voir par exemple math.mcgill.ca/dstephens/OldCourses/204-2007/Handouts/…
Momo