Test statistique pour vérifier quand deux séries chronologiques similaires commencent à diverger

10

Dès le titre je voudrais savoir s'il existe un test statistique qui peut m'aider à identifier une divergence significative entre deux séries chronologiques similaires. Plus précisément, en regardant la figure ci-dessous, je voudrais détecter que les séries commencent à diverger à l'instant t1, c'est-à-dire lorsque la différence entre elles commence à être significative. De plus, je détecterais également quand la différence entre les séries redeviendra non significative.

Existe-t-il un test statistique utile pour ce faire?

entrez la description de l'image ici

Ugo Giordano
la source

Réponses:

7

Il y a quelques façons qui me viennent à l'esprit. La première consiste à faire la différence entre les deux séries et à créer une "nouvelle série". Analysez cette série et identifiez empiriquement les impulsions, les changements de niveau / les tendances temporelles locales et un éventuel composant ARIMA. Les résultats suggéreront / pourraient suggérer toute divergence identifiable. Une deuxième approche consiste à construire un modèle ARIMA commun pour les deux séries chronologiques et à utiliser le CHOW TEST pour tester les paramètres statistiquement significatifs.

IrishStat
la source
1

Une autre approche qui pourrait fonctionner consiste à envisager des algorithmes pour la détection des changements.

Une première idée est d'appliquer une méthode de détection de changement comme CUSUM sur les deux séries et de comparer les points de changement. Dans votre exemple, il est très probable que la série rouge produira un point de changement à t1 alors que la série jaune ne le fera pas. Fait intéressant, le rouge et le jaune donneraient probablement tous les deux un point de changement à la première bosse de la courbe (selon la sensibilité des paramètres CUSUM), mais cela ne vous dérange pas vraiment car ils se comportent de la même manière.

oDDsKooL
la source
1

Quelques options que vous voudrez peut-être envisager:

  1. Si vous cherchez à identifier une différence significative, un graphique SPC (Statistical Process Control) utilisant les règles de Western Electric peut également vous aider à identifier qu'il se produit. Comme l'a suggéré @IrishStat, représenter graphiquement la différence entre les deux séries chronologiques est le meilleur début. Il est alors bon d'appliquer des règles SPC basées sur l'analyse d'une période stable des deux séries chronologiques.

https://en.wikipedia.org/wiki/Western_Electric_rules

  1. Une approche pragmatique plus détaillée est la chronostatistique qui est largement acceptée dans l'industrie minière pour identifier le changement et les caractéristiques spécifiques du bruit dans les données de séries chronologiques. Comme vous pouvez l'imaginer, dans un environnement où vous êtes intéressé par 0,001% de la matière, l'incertitude dans l'échantillonnage et la variabilité du processus doivent être comprises pour savoir si vous avez une différence sur deux séries temporelles.

En tant qu'ingénieur des procédés miniers, j'ai l'habitude de traiter des données de séries chronologiques qui sont beaucoup plus bruyantes que cela et la chronostatistique (les partisans incluent Pierre Gy et Francis Pitard) permet d'identifier les erreurs introduites par la technique d'échantillonnage des données et d'autres aspects des données rassemblement. Des articles plus accessibles (c'est-à-dire plus faciles pour les statisticiens non professionnels) ont été rédigés par Tim Napier-Munn qui a une approche très basée sur l'application pour évaluer les données de séries chronologiques.

Je ne connais aucun article open source, mais ces deux auteurs ont publié via Elsevier.

MarkR
la source