Quelqu'un peut-il expliquer la fonction d'autocorrélation dans une série chronologique? En appliquant acf aux données, quelle serait l'application?
autocorrelation
user1471980
la source
la source
Réponses:
Contrairement aux données d'échantillonnage ordinaires, les données de séries chronologiques sont ordonnées. Par conséquent, il existe des informations supplémentaires sur votre échantillon dont vous pourriez tirer parti, s'il existe des modèles temporels utiles. La fonction d'autocorrélation est l'un des outils utilisés pour trouver des modèles dans les données. Plus précisément, la fonction d'autocorrélation vous indique la corrélation entre des points séparés par différents décalages temporels. À titre d'exemple, voici quelques valeurs de fonction acf possibles pour une série avec des périodes de temps discrètes:
La notation est ACF (n = nombre de périodes entre les points) = corrélation entre les points séparés par n périodes. Je vais donner des exemples pour les premières valeurs de n.
ACF (0) = 1 (toutes les données sont parfaitement corrélées avec elles-mêmes), ACF (1) = .9 (la corrélation entre un point et le point suivant est de 0,9), ACF (2) = .4 (la corrélation entre un point et un point à deux pas est 0.4) ... etc.
Ainsi, l'ACF vous indique la corrélation des points entre eux, en fonction du nombre de pas de temps par lesquels ils sont séparés. C'est l'essentiel de l'autocorrélation, c'est la corrélation entre les points de données passés et les points de données futurs, pour différentes valeurs de la séparation temporelle. En règle générale, vous vous attendez à ce que la fonction d'autocorrélation chute vers 0 lorsque les points deviennent plus séparés (c'est-à-dire que n devient grand dans la notation ci-dessus) car il est généralement plus difficile de prévoir plus loin dans le futur à partir d'un ensemble de données donné. Ce n'est pas une règle, mais c'est typique.
Maintenant, à la deuxième partie ... pourquoi nous en soucions-nous? L'ACF et sa fonction sœur, le partielLa fonction d'autocorrélation (plus à ce sujet dans un peu), est utilisée dans l'approche de modélisation Box-Jenkins / ARIMA pour déterminer comment les points de données passés et futurs sont liés dans une série chronologique. La fonction d'autocorrélation partielle (PACF) peut être considérée comme la corrélation entre deux points séparés par un certain nombre de périodes n, MAIS avec l'effet des corrélations intermédiaires supprimées. Ceci est important car disons qu'en réalité, chaque point de données n'est directement corrélé qu'au point de données NEXT, et aucun autre. Cependant, cela APPARAÎTra comme si le point actuel est corrélé avec des points plus loin dans le futur, mais uniquement en raison d'un effet de type "réaction en chaîne", c'est-à-dire que T1 est directement corrélé avec T2 qui est directement corrélé avec T3, donc il ressemble à T1 est directement corrélé avec T3. Le PACF supprimera la corrélation intermédiaire avec T2 afin que vous puissiez mieux discerner les modèles. Une belle introduction à ceci estici.
Le manuel NIST Engineering Statistics, en ligne, contient également un chapitre à ce sujet et un exemple d'analyse de séries chronologiques utilisant l'autocorrélation et l'autocorrélation partielle. Je ne le reproduirai pas ici, mais parcourez-le et vous devriez avoir une bien meilleure compréhension de l'autocorrélation.
la source
permettez-moi de vous donner une autre perspective.
tracer les valeurs décalées d'une série chronologique avec les valeurs actuelles de la série chronologique.
si le graphique que vous voyez est linéaire, cela signifie qu'il existe une dépendance linéaire entre les valeurs actuelles de la série chronologique et les valeurs décalées de la série chronologique.
les valeurs d'autocorrélation sont le moyen le plus évident de mesurer la linéarité de cette dépendance.
la source