Pourquoi l' autocorrélation est-elle si importante? J'en ai compris le principe (je suppose ..) mais comme il y a aussi des exemples où aucune autocorrélation ne se produit, je me demande: tout n'est pas dans la nature en quelque sorte autocorrélé? Le dernier aspect vise plus à une compréhension générale de l'autocorrélation elle-même parce que, comme je l'ai mentionné, tous les états de l'univers ne dépendent-ils pas du précédent?
22
Réponses:
L'autocorrélation a plusieurs interprétations en langage simple qui signifient que les processus et modèles non autocorrélés ne:
Une variable autocorrélée a en mémoire ses valeurs précédentes. Ces variables ont un comportement qui dépend de ce qui s'est passé auparavant. La mémoire peut être longue ou courte par rapport à la période d'observation; la mémoire peut être infinie; la mémoire peut être négative (c'est-à-dire qu'elle peut osciller). Si vos théories directrices disent que le passé (d'une variable) reste avec nous, alors l'autocorrélation en est une expression. (Voir, par exemple, Boef, SD (2001). Modélisation des relations d'équilibre: modèles de correction d'erreurs avec des données fortement autorégressives . Political Analysis , 9 (1), 78–94, ainsi que de Boef, S., et Keele, L. ( 2008). Prendre le temps au sérieux . American Journal of Political Science , 52 (1), 184–200.)
Une variable autocorrélée implique un système dynamique . Les questions que nous posons et auxquelles nous répondons sur le comportement des systèmes dynamiques sont différentes de celles que nous posons sur les systèmes non dynamiques. Par exemple, lorsque les effets causaux pénètrent dans un système, et combien de temps les effets d'une perturbation à un moment donné restent pertinents sont répondus dans le langage des modèles autocorrélés. (Voir, par exemple, Levins, R. (1998). Dialectics and Systems Theory . Science & Society , 62 (3), 375–399, mais aussi la citation pesaréenne ci-dessous.)
Une variable autocorrélée implique un besoin de modélisation de séries chronologiques (sinon de modélisation de systèmes dynamiques également). Les méthodologies de séries chronologiques reposent sur des comportements autorégressifs (et une moyenne mobile, qui est une hypothèse de modélisation concernant la structure des erreurs en fonction du temps), tentant de capturer les détails saillants du processus de génération de données , et se distinguent nettement, par exemple, de la manière suivante: appelés «modèles longitudinaux» qui incorporent simplement une certaine mesure du temps comme variable dans un modèle par ailleurs non dynamique sans autocorrélation. Voir, par exemple, Pesaran, MH (2015) Time Series and Panel Data in Econometrics , New York, NY: Oxford University Press.
Avertissement: j'utilise "autorégression" et "autorégressif" pour impliquer n'importe quelle structure de mémoire à une variable en général, indépendamment des propriétés à court terme, à long terme, racine unitaire, explosives, etc. de ce processus.
la source
Une tentative de réponse.
L'autocorrélation n'est pas différente de toute autre relation entre les prédicteurs. C'est juste que le prédicteur et la variable dépendante se trouvent être la même série temporelle, juste décalée.
Oui en effet. Tout comme l'état de chaque objet dans l'univers dépend de tous les autres objets, via toutes sortes de forces physiques. La question est simplement de savoir si la relation est suffisamment forte pour être détectable ou suffisamment forte pour nous aider à prévoir les états.
Et la même chose s'applique à l'autocorrélation. C'est toujours là. La question est de savoir si nous devons le modéliser ou si le modéliser introduit simplement une incertitude supplémentaire (le compromis biais-variance), ce qui nous rend encore plus mal lotis que de ne pas le modéliser.
Un exemple de mon travail personnel: je prédis les ventes des supermarchés. La consommation de lait de mon ménage est assez régulière. Si je n'ai pas acheté de lait depuis trois ou quatre jours, il y a de fortes chances que j'arrive aujourd'hui ou demain pour acheter du lait. Si le supermarché veut prévoir la demande de lait de mon ménage , il doit absolument tenir compte de cette autocorrélation.
Cependant, je ne suis pas le seul client de mon supermarché. Il y a peut-être encore 2 000 ménages qui y achètent leurs produits alimentaires. La consommation de lait de chacun est à nouveau autocorrélée. Mais comme le taux de consommation de chacun est différent, l'autocorrélation globale est tellement atténuée qu'il n'est peut-être plus logique de la modéliser. Il a disparu dans la demande quotidienne générale, c'est-à-dire l'interception. Et comme le supermarché ne se soucie pas à qui il vend du lait, il modélisera la demande globale et n'inclura probablement pas l'autocorrélation.
(Oui, il y a une saisonnalité intra-hebdomadaire. Ce qui est une sorte d'autocorrélation, mais cela dépend vraiment du jour de la semaine, pas de la demande le même jour de semaine une semaine plus tôt, donc c'est plus un effet de jour de semaine que l'autocorrélation saisonnière. )
la source
Tout d'abord, je pense que vous voulez dire quel est le but d'évaluer l'autocorrélation et de la traiter. Si vous voulez vraiment dire le «but de l'autocorrélation», c'est la philosophie, pas les statistiques.
Deuxièmement, les états de l'univers sont corrélés avec les états précédents, mais tous les problèmes statistiques ne traitent pas des états de la nature antérieurs. De nombreuses études sont transversales.
Troisièmement, devons-nous le modéliser lorsqu'il est là? Les méthodes font des hypothèses. La plupart des formes de régression ne supposent aucune autocorrélation (c'est-à-dire que les erreurs sont indépendantes). Si nous violons cette hypothèse, nos résultats pourraient être erronés. Jusqu'où mal? Une façon de le dire serait de faire la régression habituelle et également un modèle qui tient compte de l'autocorrélation (par exemple, des modèles à plusieurs niveaux ou des méthodes de séries chronologiques) et de voir à quel point les résultats sont différents. Mais, je pense qu'en général, la prise en compte de l'auto-corrélation réduira le bruit et rendra le modèle plus précis.
la source