J'essaie de comprendre comment R calcule l'autocorrélation lag-k (apparemment, c'est la même formule utilisée par Minitab et SAS), afin de pouvoir le comparer à l'utilisation de la fonction CORREL d'Excel appliquée à la série et à sa version k-lagged. R et Excel (en utilisant CORREL) donnent des valeurs d'autocorrélation légèrement différentes.
Je serais également intéressé de savoir si un calcul est plus correct que l'autre.
r
sas
autocorrelation
excel
Galit Shmueli
la source
la source
R
La formule est analysée plus en détail et expliquée sur stats.stackexchange.com/questions/81754/… .Réponses:
L'équation exacte est donnée dans: Venables, WN et Ripley, BD (2002) Modern Applied Statistics with S. Fourth Edition. Springer-Verlag. Je vais vous donner un exemple:
Et ainsi de suite (par exemple,
res[1:47]
etres[4:50]
pour le décalage 3).la source
La manière naïve de calculer la corrélation automatique (et éventuellement ce qu'Excel utilise) est de créer 2 copies du vecteur puis de supprimer les 1ers n éléments de la première copie et les n derniers éléments de la deuxième copie (où n est le décalage que vous calculent à partir de). Passez ensuite ces 2 vecteurs à la fonction pour calculer la corrélation. Cette méthode est OK et donnera une réponse raisonnable, mais elle ignore le fait que les 2 vecteurs comparés sont vraiment des mesures de la même chose.
La version améliorée (comme le montre Wolfgang) est une fonction similaire à la corrélation régulière, sauf qu'elle utilise le vecteur entier pour calculer la moyenne et la variance.
la source