Je suis sûr que je manque quelque chose d'évident ici, mais je suis plutôt confus avec des termes différents dans le domaine des séries chronologiques. Si je comprends bien, les erreurs autocorrélées en série sont un problème dans les modèles de régression (voir par exemple ici ). Ma question est maintenant ce qui définit exactement une erreur autocorrélée? Je connais la définition de l'autocorrélation et je peux appliquer les formules, mais c'est plus un problème de compréhension avec les séries temporelles dans les régressions.
Par exemple, prenons la série chronologique des températures quotidiennes: S'il fait chaud aujourd'hui (heure d'été!), Il fait probablement aussi chaud demain, et vice versa. Je suppose que j'ai un problème pour appeler ce phénomène un phénomène "d'erreurs autocorrélées en série" parce qu'il ne me semble pas simplement comme une erreur, mais comme quelque chose attendu.
Plus formellement, supposons une configuration de régression avec une variable dépendante et une variable indépendante et le modèle.
Est-il possible que est autocorrélé, tandis que est iid? Si oui, qu'est-ce que cela signifie pour toutes ces méthodes qui ajustent les erreurs standard pour l'autocorrélation? Devez-vous toujours le faire ou ne s'appliquent-ils qu'aux erreurs autocorrélées? Ou voudriez-vous toujours modéliser l'autocorrélation dans un tel paramètre dans le terme d'erreur, donc cela ne fait fondamentalement aucune différence si est autocorrélé ou ?
Ceci est ma première question ici. J'espère que ce n'est pas trop déroutant et j'espère que je n'ai rien manqué d'évident ... J'ai également essayé de le chercher sur Google et j'ai trouvé des liens intéressants (par exemple, ici sur SA ), mais rien ne m'a vraiment aidé.
la source
Juste pour ajouter à Dimitriy une très bonne réponse: l'autocorrélation d'erreur pose des problèmes pour le calcul de l'erreur standard des coefficients et donc des niveaux de signification, ou valeur p, ce qui rend la sélection des IV moins simple.R2 et la valeur F sont également affectées.
De toutes les hypothèses de régression linéaire (homoscédasticité, indépendance des résidus, linéarité de la relation IVs -> DV, normalité des résidus) la linéarité et l'indépendance des résidus sont celles qui impactent les résultats plus sérieusement en cas de violation.
la source