J'ai deux séries chronologiques, montrées dans l'intrigue ci-dessous:
Le graphique montre les détails complets des deux séries chronologiques, mais je peux facilement le réduire aux observations coïncidentes si nécessaire.
Ma question est la suivante: quelles méthodes statistiques puis-je utiliser pour évaluer les différences entre les séries chronologiques?
Je sais que la question est assez large et vague, mais je ne trouve pas beaucoup de matériel d’introduction à ce sujet où que ce soit. Comme je peux le voir, il y a deux choses distinctes à évaluer:
1. Les valeurs sont-elles les mêmes?
2. Les tendances sont-elles les mêmes?
Quel type de tests statistiques suggéreriez-vous de regarder pour évaluer ces questions? Pour la question 1, je peux évidemment évaluer les moyennes des différents jeux de données et rechercher des différences significatives dans les distributions, mais existe-t-il un moyen de prendre en compte la nature chronologique des données?
Pour la question 2 - y a-t-il quelque chose comme les tests de Mann-Kendall qui recherche la similitude entre deux tendances? Je pourrais faire le test Mann-Kendall pour les deux jeux de données et comparer, mais je ne sais pas si c'est une façon valable de faire les choses ou s'il existe une meilleure façon?
Je fais tout cela en R, donc si les tests que vous suggérez ont un paquet R, faites-le moi savoir.
la source
Réponses:
Comme d’autres l’ont dit, vous devez avoir une fréquence de mesure commune (c’est-à-dire le temps entre les observations). Cela étant fait, j’identifierais un modèle commun qui décrirait raisonnablement chaque série séparément. Il peut s'agir d'un modèle ARIMA ou d'un modèle de régression à tendances multiples, avec des décalages de niveau possibles, ou d'un modèle composite intégrant des variables de mémoire (ARIMA) et factices. Ce modèle commun pourrait être estimé globalement et séparément pour chacune des deux séries, puis on pourrait construire un test F pour tester l'hypothèse d'un ensemble commun de paramètres.
la source
Considérez le
grangertest()
dans la bibliothèque lmtest .C'est un test pour voir si une série temporelle est utile pour en prévoir une autre.
Quelques références pour vous aider à démarrer:
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/
https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf
http://en.wikipedia.org/wiki/Granger_causality
la source
Je viens de découvrir cela. Votre première réponse consiste à tracer les deux ensembles sur la même échelle (dans le temps) pour voir les différences visuellement. Vous l'avez fait et vous pouvez facilement voir qu'il existe des différences criantes. L'étape suivante consiste à utiliser une analyse de corrélation simple ... et à voir dans quelle mesure ils sont liés à l'aide du coefficient de corrélation (r). Si le nombre de r est faible, votre conclusion serait qu'ils sont faiblement liés et donc aucune comparaison souhaitable et une valeur plus grande si r suggèrent de bonnes comparaisons entre les deux séries. La troisième étape où il existe une bonne corrélation consiste à tester la signification statistique de r. Ici, vous pouvez utiliser le test de Shapiro Welch qui supposerait que les deux séries sont normalement distribuées (hypothèse nulle) ou non (hypothèse alternative). Il y a d'autres tests que vous pouvez faire mais laissez-moi espérer que ma réponse aidera.
la source
Ajustez une ligne droite aux deux signaux de la série chronologique à l’aide de polyfit. Ensuite, calculez l'erreur quadratique moyenne (RMSE) pour les deux lignes. La valeur obtenue pour la ligne rouge serait assez inférieure à celle obtenue pour la ligne grise.
Faites également des lectures sur une fréquence commune.
la source