Qu'entend-on par «niveau» d'une série chronologique?

9

Dans une grande partie de la littérature que j'étudie, c'est l'un de ces termes qui revient fréquemment mais sans définition rigoureuse. Plus précisément, on me dit:

Pour les variables aléatoires indexées dans le temps (RVs) , le modèle de décomposition additive est donné comme{Xt}

Xt=ll(Xt1,Xt2,)+fc(Xt1,Xt2,,εt,εt1,)

  • ll est le niveau à long terme , qui est un processus stochastique et peut être visualisé comme une version lissée de , à ne pas confondre avec les tendances qui sont des modèles déterministes{Xt}
  • fc est la composante de fluctuation qui représente les changements du niveau local , supposé stationnaire et avec un niveau moyen nul
  • {εt} sont des innovations et sont des VR à moyenne nulle IID

Mais quelle est la différence de sens entre la tendance par rapport à niveau à long terme par rapport à l' échelon local par rapport à niveau moyen ?

De plus, la composante de fluctuation et les innovations ne modélisent-elles pas la même chose, quel est le bruit associé à chaque observation? Alors pourquoi compliquer les choses en incluant les deux?

mchen
la source

Réponses:

1

Cela a à voir avec l' ordre d'intégration . On dit qu'un processus stochastique est intégré d'ordre , de manière équivalente ~ s'il est stationnaire. Si ~ avec , le processus est dit intégré d'ordre et est alors non stationnaire. La décomposition ci-dessus tente de filtrer les composantes stationnaires (comme composante de fluctuation et innovations) et la composante de tendance stochastique non stationnaire. Une tendance stochastique est différente d'une tendance déterministe , et l'utilisation du mot tendance dans le passage est bâclée.Xt0XtI(0)XtI(d)d>0,dNd

Maintenant, cela rend le son plus compliqué qu'il ne l'est. Prenons un exemple. Prenez ~ comme un processus de bruit blanc et laissez être . Définissez le polynôme de décalage suivantεt(0,σ2)εtiid

C1(L)=0.5L+0.25L20.75L30.05L4

L'opérateur de décalage fonctionne sur des variables aléatoires indexées dans le temps comme . Supposons maintenant que est généré commeLLkε:=εtkXt

Xt=Xt1+C1(L)εt+εt

Ensuite, en utilisant la terminologie de votre extrait, le niveau à long terme serait défini par , la composante saisonnière / fluctuation par et les innovations par . Comme décrit dans l'extrait, la composante de fluctuation et les innovations sont stationnaires.Xt1C1(L)εtεt

La raison pour laquelle on l'appelle ainsi est quelque peu difficile à comprendre sans faire d'autres remarques et renvoie à l'ordre d'intégration susmentionné. Habituellement, nous ne rencontrons pas de processus qui sont intégrés d'ordres supérieurs à ou , alors considérons l'exemple ci-dessus d'ordre d'intégration .121

Tout d'abord, définissez . est stationnaire, donc ~ . Nous pouvons maintenant écrire cela nous dit que ~ , car sa première différence est intégrée d'ordre . La signification de ceci pourrait être difficile à saisir, jusqu'à ce que l'on réalise ce que signifie réellement. Cela signifie que l'on peut réécrire Cela pourrait ne pas sembler dramatique:ut:=C1(L)εt+εtututI(0)

Xt=Xt1+utXtXt1=(1L)Xt=ΔXt=ut
XtI(1)0ΔXt=ut
Xt=i=1ΔXt=i=1ut
E(Xt)=0 , après tout! Cependant, la variance de ce processus n'est pas finie et explose en . C'est pourquoi nous disons que le terme définit une tendance stochastique: bien qu'il ne soit pas déterministe (comme par exemple une tendance linéaire), ne sera stationnaire qu'une fois que nous aurons filtré la composante non stationnaire et la soustraire de . (Dans ce cas, comme observé précédemment, aurait filtré le composant non stationnaire et serait stationnaire.) Si vous ne le faites pas , vos procédures habituelles d'inférence statistique ne fonctionnent plus, puisqueXtXtΔXt=XtXt1=C1(L)εt+εtXtconvergera vers un mouvement brownien par le principe d'invariance / théorème de limite centrale fonctionnelle. Ces résultats remplacent les résultats CLR standard pour les autorégressions, les problèmes de cointégration, etc.
Jeremias K
la source