J'ai une série chronologique simple avec 5 à 10 points de données par ensemble de données à intervalles réguliers. Je me demande quelle est la meilleure façon de déterminer si deux ensembles de données sont différents. Dois-je essayer des tests t sur chaque point de données, ou regarder la zone sous les courbes ou existe-t-il une sorte de modèle multivarié qui fonctionnerait mieux?
16
Réponses:
Vous devrez spécifier précisément ce que vous entendez par «différent». Vous devrez également spécifier les hypothèses que vous êtes prêt à faire sur la structure de corrélation en série dans chaque série chronologique.
Avec les tests t, vous comparez la moyenne de chaque groupe et vous supposez que les groupes sont constitués d'observations indépendantes avec des variances égales (cette dernière est parfois détendue). Lors du test de séries chronologiques, l'hypothèse d'indépendance n'est généralement pas raisonnable, mais vous devez ensuite la remplacer par une structure de corrélation spécifiée - par exemple, vous pouvez supposer que les séries chronologiques suivent les processus AR (1) avec une autocorrélation égale. Par conséquent, même la comparaison des moyennes de deux séries chronologiques ou plus est considérablement plus difficile qu'avec des données indépendantes.
Je préciserais soigneusement les hypothèses que je voulais faire sur chaque série chronologique et ce que je souhaitais comparer, puis j'utiliserais un bootstrap paramétrique (basé sur le modèle supposé) pour effectuer le test.
la source
Peut-être que vous voulez des mesures répétées anova. Il vous permet de comparer les sujets (facteurs inter-sujets) tout en prenant la structure corrélée des "séries chronologiques" par sujet (facteur intra-sujet). C'est une méthode simple mais datée et qui peut être trouvée dans le contexte des "modèles linéaires généraux", elle a besoin de quelques fonctionnalités supplémentaires (par exemple la sphéricité). Une autre façon pourrait être des modèles linéaires mixtes qui permettent des structures de corrélations plus générales (même AR (1) comme Rob l'a suggéré) et des données déséquilibrées.
la source
Si vous voulez supposer une tendance linéaire simple, vous pouvez prendre la différence de chaque ensemble de données aux différents points dans le temps et tester que la pente de la ligne est nulle.
-Ralph Winters
la source