Explication intuitive de la stationnarité

14

Je luttais avec la stationnarité dans ma tête pendant un moment ... C'est comme ça que vous en pensez? Tous commentaires ou réflexions seront appréciés.

Le processus stationnaire est celui qui génère des valeurs chronologiques telles que la moyenne de distribution et la variance sont maintenues constantes. Strictement parlant, ceci est connu sous le nom de forme faible de stationnarité ou covariance / stationnarité moyenne.

La stationnarité est faible lorsque la série chronologique a une moyenne et une variance constantes tout au long du temps.

Soyons simples, les praticiens disent que la série chronologique stationnaire est celle sans tendance - oscille autour de la moyenne constante et a une variance constante.

La covariance entre différents décalages est constante, elle ne dépend pas de l'emplacement absolu dans les séries chronologiques. Par exemple, la covariance entre t et t-1 (décalage du premier ordre) devrait toujours être la même (pour la période de 1960-1970 identique à celle de 1965-1975 ou toute autre période).

Dans les processus non stationnaires, il n'y a pas de moyenne à long terme à laquelle la série revient; nous disons donc que les séries chronologiques non stationnaires ne signifient pas revenir. Dans ce cas, la variance dépend de la position absolue dans les séries temporelles et la variance va à l'infini au fil du temps. Techniquement parlant, les auto-corrélations ne se désintègrent pas avec le temps, mais dans de petits échantillons, elles disparaissent - bien que lentement.

Dans les processus stationnaires, les chocs sont temporaires et se dissipent (perdent de l'énergie) avec le temps. Après un certain temps, ils ne contribuent pas aux nouvelles valeurs de séries chronologiques. Par exemple, quelque chose qui s'est produit il y a longtemps (assez longtemps), comme la Seconde Guerre mondiale, a eu un impact, mais, si la série chronologique d'aujourd'hui est la même que si la Seconde Guerre mondiale ne s'était jamais produite, nous dirions que le choc a perdu son énergie ou dissipé. La stationnarité est particulièrement importante car de nombreuses théories économétriques classiques sont dérivées sous les hypothèses de stationnarité.

Une forte forme de stationnarité est lorsque la distribution d'une série chronologique est exactement le même temps de creux. En d'autres termes, la distribution des séries chronologiques originales est exactement la même que celle des séries temporelles décalées (de n'importe quel nombre de retards) ou même de sous-segments de la série chronologique. Par exemple, une forme forte suggère également que la distribution devrait être la même, même pour des sous-segments 1950-1960, 1960-1970 ou même des périodes qui se chevauchent comme 1950-1960 et 1950-1980. Cette forme de stationnarité est appelée forte car elle ne suppose aucune distribution. Il indique seulement que la distribution de probabilité devrait être la même. Dans le cas d'une stationnarité faible, nous avons défini la distribution par sa moyenne et sa variance. Nous pourrions faire cette simplification car implicitement, nous avons supposé une distribution normale, et la distribution normale est entièrement définie par sa moyenne et sa variance ou écart-type. Ce n'est rien d'autre que de dire que la mesure de probabilité de la séquence (dans les séries temporelles) est la même que celle de la séquence retardée / décalée des valeurs dans la même série temporelle.

user333
la source
3
Eh bien, je ne comprends pas la question, voulez-vous simplifier la description informelle du concept de stationnarité que vous avez citée ici? Si vous demandez si cette explication est correcte, oui, elle l'est. Bien que la non-stationnarité ait beaucoup plus de formes, toute dépendance temporelle dans les moments jusqu'au second ordre en sera la source dans les cas faibles (des changements structurels pourraient être ajoutés, par exemple). Cherchez-vous d'autres citations?
Dmitrij Celov
Merci. J'espérais recevoir des commentaires pointant sur des aspects importants de la stationnarité (en tant que concept) qui ne sont pas là ...
user333

Réponses:

7

Tout d'abord, il est important de noter que la stationnarité est une propriété d'un processus et non d'une série temporelle. Vous considérez l'ensemble de toutes les séries chronologiques générées par un processus. Si les propriétés statistiques¹ de cet ensemble (moyenne, variance,…) sont constantes dans le temps, le processus est appelé stationnaire. À strictement parler, il est impossible de dire si une série chronologique donnée a été générée par un processus stationnaire (cependant, avec certaines hypothèses, nous pouvons faire une bonne supposition).

Plus intuitivement, la stationnarité signifie qu'il n'y a pas de points distincts dans le temps pour votre processus (influençant les propriétés statistiques de votre observation). Que cela s'applique à un processus donné dépend essentiellement de ce que vous considérez comme fixe ou variable pour votre processus, c'est-à-dire ce qui est contenu dans votre ensemble.

Une cause typique de non-stationnarité sont les paramètres dépendant du temps - qui permettent de distinguer les points temporels par les valeurs des paramètres. Une autre cause est des conditions initiales fixes.

Considérez les exemples suivants:

  • Le bruit atteignant ma maison d'une seule voiture passant à un moment donné n'est pas un processus stationnaire. Par exemple, l'amplitude moyenne² est la plus élevée lorsque la voiture est directement à côté de ma maison.

  • Le bruit atteignant ma maison à cause du trafic routier en général est un processus stationnaire, si nous ignorons la dépendance temporelle de l'intensité du trafic (par exemple, moins de trafic la nuit ou le week-end). Il n'y a plus de points distingués dans le temps. Bien qu'il puisse y avoir de fortes fluctuations de séries chronologiques individuelles, celles-ci disparaissent lorsque je considère l'ensemble de toutes les réalisations du processus.

  • Si nous incluons les impacts connus sur l'intensité du trafic, par exemple qu'il y a moins de trafic la nuit, le processus est à nouveau non stationnaire: l'amplitude moyenne² varie avec un rythme quotidien. Chaque moment dans le temps se distingue par l'heure de la journée.

  • La position d'un seul grain de poivre dans une casserole d'eau bouillante est un processus stationnaire (ignorant la perte d'eau due à l'évaporation). Il n'y a aucun moment distinct dans le temps.

  • t=0t=0t=εε petit), nous pouvons être sûrs que le poivre est quelque part près du milieu pour chaque réalisation du processus , tandis qu'à un moment ultérieur, il peut également être plus proche de la bordure du pot.

    t>TT


¹ Pour des raisons pratiques, cela est parfois réduit à la moyenne et à la variance (stationnarité faible), mais je ne considère pas cela utile pour comprendre le concept. Ignorez simplement la stationnarité faible jusqu'à ce que vous compreniez la stationnarité.
² Ce qui est la moyenne du volume, mais l'écart type du signal sonore réel (ne vous en faites pas trop ici).

Wrzlprmft
la source
0

Pour plus de clarté, j'ajouterais que toute série chronologique où les points de données sont normalement distribués dans le temps avec une moyenne et une variance constantes est considérée comme une forte série chronologique stationnaire étant donné la moyenne et l'écart-type, la distribution normale aura toujours la même courbe de distribution de probabilité ( les entrées de l'équation normale ne dépendent que de la moyenne et de l'écart-type).

Ce n'est pas le cas avec une distribution t, par exemple, où une entrée dans l'équation de distribution t est gamma, ce qui a un impact sur la forme de la courbe de distribution malgré une moyenne et un écart-type constants.

Ryan Chase
la source
2
Dans le cas des marginaux normaux, vous décrivez une forme de stationnarité de second ordre , ce qui n'est pas, je pense, ce que vous entendez par stationnarité "forte". Pour que la stationnarité se vérifie, vous devez en outre supposer que le processus est gaussien (c'est-à-dire que la distribution conjointe de tout nombre fini de valeurs doit être multivariée normale) et que les covariances dépendent uniquement des différences de temps. On ne sait pas exactement ce que vous entendez par "une entrée dans l'équation de la distribution t" ou à quoi "gamma" pourrait faire référence.
whuber