Question sur l'exemple de fonction d'autocovariance

10

Je lis un livre d'analyse de séries chronologiques et la formule de l'échantillon d'autocovariance est définie dans le livre comme:

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

avecpour . est la moyenne.γ^(h)=γ^(h)ˉ xh=0,1,...,n1x¯

Quelqu'un peut-il expliquer intuitivement pourquoi nous divisons la somme par et non par ? Le livre explique que cela est dû au fait que la formule ci-dessus est une fonction définie non négative et donc la division par est préférée, mais cela n'est pas clair pour moi. Quelqu'un peut-il prouver cela ou montrer un exemple ou quelque chose?n - h nnnhn

Pour moi, la chose intuitive au début serait de diviser par . Est-ce un estimateur non biaisé ou biaisé de l'autocovariance?nh

jjepsuomi
la source
1
Si votre série chronologique est exactement avec tous les autres , ou étant inconnus, alors la somme doit nécessairement s'arrêter à lorsque se produit dans la somme: le terme suivant (pour ) qui serait inclus dans la somme aurait , et ne fait pas partie de l'échantillon. x i i < 1 i > n t = n - h x t + h = x n t = n - h + 1 x n - h + 1 + h = x n + 1 x n + 1x1,x2,,xnxii<1i>nt=nhxt+h=xnt=nh+1xnh+1+h=xn+1xn+1
Dilip Sarwate
@Dilip Je ne pense pas que ce soit le problème: la question concerne la division par ou dans la définition de . n - h γnnhγ^
whuber

Réponses:

14

t1,t2,...,tkXt1,Xt2,...,Xtk( γ (ti-tj),1i,jk)γ^ est utilisé pour créer des matrices de covariance: étant donné les "temps" , il estime que la covariance du vecteur aléatoire (obtenu à partir du champ aléatoire à ces moments) est la matrice . Pour de nombreux problèmes, tels que la prédiction, il est crucial que toutes ces matrices soient non singulières. En tant que matrices de covariance putatives, elles ne peuvent évidemment pas avoir de valeurs propres négatives, d'où elles doivent toutes être définies positivement.t1,t2,,tkXt1,Xt2,,Xtk(γ^(titj),1i,jk)

La situation la plus simple dans laquelle la distinction entre les deux formules

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

et

γ^0(h)=(nh)1t=1nh(xt+hx¯)(xtx¯)

apparaît lorsque a une longueur de ; disons, . Pour et il est simple de calculerx2x=(0,1)t1=tt2=t+1

γ^0=(14141414),

qui est singulier, alors que

γ^=(14181814)

qui a des valeurs propres et , d'où elle est définie positive.3/81/8

Un phénomène similaire se produit pour , où est défini positif mais lorsqu'il est appliqué aux temps , disons - dégénère en une matrice de rang (ses entrées alternent entre et ).x=(0,1,0,1)γ^γ^0ti=(1,2,3,4)11/41/4

(Il y a un modèle ici: des problèmes surviennent pour tout de la forme .)x(a,b,a,b,,a,b)

Dans la plupart des applications, la série d'observations est si longue que pour la plupart des d'intérêt - qui sont bien inférieurs à - la différence entre et est sans conséquence. Ainsi, dans la pratique, la distinction n'est pas très importante et, théoriquement, le besoin de caractère positif l'emporte fortement sur tout désir possible d'estimations non biaisées.xthnn1(nh)1

whuber
la source
1
Je pense qu'il est important de noter que les deux estimateurs sont des estimateurs biaisés, même si vous le divisez par nh.
Ran
@Ran Bien que vous ayez raison de dire que ces estimateurs sont biaisés, je ne suis pas d'accord pour dire qu'il s'agit d'un problème important: comme mentionné dans le dernier paragraphe, une petite quantité de biais est le moindre des soucis de quiconque. L'estimateur sans biais, utilisant , ne diffère guère de ou . (nh1)1γ^γ^0
whuber
2
Très belle réponse +1. Il est peut-être utile d'ajouter le point que , tandis que , donc quand est proche de , l'estimateur peut être erratique, tandis que aura des fluctuations d'échantillonnage uniformément petites . Voir par exemple Priestly (1981) "Spectral Analysis and Time Series" p324 pour une discussion détaillée de ce pointV γ ( h ) = O ( 1 / n ) h n γ 0 ( h ) γ ( h ) hVγ^0(h)=O(1/(nh))Vγ^(h)=O(1/n)hnγ^0(h)γ^(h)h
Colin T Bowers