Lignes pointillées dans le tracé ACF en R

9

Je passe en revue le livre «Introductory Time Series with R» de Cowpertwait et Metcalfe. À la page 36, il indique que les lignes sont à: . J'ai lu ici R forum que les lignes sont à . 1/n±2/n±1.96/n

J'ai exécuté le code suivant:

b = c(3,1,4,1)

acf(b)

et je vois que les lignes semblent être à ±1.96/4 . Alors, évidemment, le livre est faux? Ou, suis-je en train de mal lire ce qui a été écrit? Les auteurs parlent-ils de quelque chose de légèrement différent?

* Remarque, je ne suis pas intéressé par l'écart de détail mineur de 1,96 contre 2. Je suppose que ce n'est que l'auteur qui utilise la règle empirique de 2 sd contre 1,96 sd réel.

Edit: j'ai exécuté cette simulation:

acf1 = 0
acf2 = 0
acf3 = 0
for(i in 1:5000){
  resids= runif(1000)
  residsacf = c(acf(resids,plot= FALSE))
  acf1[i] = residsacf$acf[2,,1]
  acf2[i] = residsacf$acf[3,,1]
  acf3[i] = residsacf$acf[4,,1]
}
meanacf1 = mean(acf1)
meanacf2 = mean(acf2)
meanacf3 = mean(acf3)
meanacf1
meanacf2
meanacf3

Il me semble toujours obtenir des valeurs proches de pour les 3. 1/n

Édition supplémentaire: je vois une tendance de1/n(k1)/n2

Adam
la source
1
Vraiment, ? Centré sur ? -11n±2n1n
mpiktas
Dans Enders ' Applied Economic Time Series (2e édition, pp 67-68) explique que le provient de Box et Jenkins (1976), Time Series Forecasting, Analysis, and Control . Enders a utilisé l'estimation suivante de :Enders utilise comme longueur de la série. var(rs)var(rs)=T - 1 ( 1+2 s - 1 j = 1 r 2 j ) . T2/Nvar(rs)
var(rs)=T1(1+2j=1s1rj2).
T
Jason Morgan
Les limites habituelles sont des valeurs critiques sous l'hypothèse nulle de bruit blanc, dans ce cas , l'expression de la variance dans Enders se réduit à . 1/T
Rob Hyndman
Shumway et Stoffer dans l' analyse des séries temporelles et ses applications: avec les exemples R, utilisez également . Voir leur code ACF disponible ici . ±2/N
Jason Morgan

Réponses:

7

L'autocorrélation de l'échantillon est biaisée négativement et le premier coefficient d'autocorrélation de l'échantillon a une moyenne de où est le nombre d'observations. Mais Metcalfe et Cowpertwait ont tort de dire que tous les coefficients d'autocorrélation ont cette moyenne, et ils ont également tort de dire que R trace les lignes à .n - 1 / n ± 1,96 / 1/nn1/n±1.96/n

Asymptotiquement, la moyenne est 0 et c'est ce que R utilise pour tracer les lignes à .±1.96/n

Rob Hyndman
la source
Merci pour la réponse Rob. Ai-je raison de comprendre que l'attente de l'ACF au décalage 1 est de -1 / n? Si c'est le cas, les lignes pointillées ne devraient-elles pas être centrées là pour le premier décalage? De plus, puisqu'il semble que ce qu'ils ont écrit n'était pas une faute de frappe. Pensez-vous qu'ils signifient quelque chose de différent ou qu'ils ont tout simplement tort? Je suis allé sur leur site Web et je ne le vois pas dans la liste des errata.
Adam
1
Pour toute taille d'échantillon raisonnable, est négligeable par rapport à donc cela n'a pas beaucoup d'importance. J'ai correspondu avec Andrew Metcalfe et il a reconnu l'erreur concernant R. Je suppose qu'ils n'ont pas encore mis à jour les errata. 2 / 1/n2/n
Rob Hyndman
Techniquement, le défaut de R n'est-il pas vrai et l'hypothèse des auteurs R était correcte?
Adam
Il y a deux problèmes. Premièrement, la moyenne de -1 / n ne s'applique qu'à la première fonction d'autocorrélation, mais les auteurs disent qu'elle s'applique à toutes les fonctions de corrélation. C'est leur erreur, pas les R. Deuxièmement, R utilise le résultat asymptotique (comme tous les autres logiciels que j'ai vus) plutôt que le petit échantillon. Donc R n'a pas tort, il utilise juste une approximation qui peut être améliorée.
Rob Hyndman
est-ce analogue au calcul de la variance de l'échantillon en utilisant n dans le dénominateur au lieu de n-1?
Adam