Souvent, dans la littérature, les auteurs se sont intéressés à trouver la distribution stationnaire d'un processus de séries chronologiques. Par exemple, considérons le processus AR ( ) simple suivant : X_t = \ alpha X_ {t-1} + e_t, où e_t \ stackrel {iid} {\ thicksim} f .
Quelle pourrait être la ou les motivations pour trouver la distribution stationnaire de tout processus stochastique?
Quelles autres analyses (théoriques et pratiques) pourrait-on faire en utilisant la distribution stationnaire résultante?
Quel (s) est (sont) le (s) problème (s) si la distribution stationnaire n'existe pas? Le processus deviendra-t-il inutile?
Et si la distribution stationnaire existe mais qu'elle n'a pas de forme fermée? Quels sont les inconvénients de ne pas avoir une expression sous forme fermée de la même chose?
Réponses:
Il existe diverses motivations à s'intéresser aux distributions stationnaires dans ce contexte, mais l'aspect le plus important est probablement qu'elles sont étroitement liées à la limitation des distributions. Pour la plupart des processus chronologiques, il existe un lien étroit entre la distribution stationnaire et la distribution limite du processus. Dans des conditions très larges, les processus de séries chronologiques basés sur des termes d'erreur IID ont une distribution stationnaire, et ils convergent vers cette distribution stationnaire en tant que distribution limite pour toute distribution de départ que vous spécifiez. Cela signifie que si vous laissez le processus s'exécuter pendant une longue période, sa distribution sera proche de la distribution stationnaire, quelle que soit la façon dont il a commencé. Ainsi, si vous avez des raisons de croire que le processus est en cours depuis longtemps,
Dans votre question, vous utilisez l'exemple d'un processus de série chronologique AR ( ) avec des termes d'erreur IID avec une distribution marginale arbitraire. Si alors ce modèle est une chaîne de Markov récurrente homogène dans le temps et sa distribution stationnaire peut être trouvée en l'inversant dans un processus MA ( ):1 | α | <1 ∞
Nous pouvons voir que le processus est une somme pondérée d'une chaîne infinie de termes d'erreur IID, où les pondérations sont en décomposition exponentielle. La distribution limite peut être obtenue à partir de la distribution d'erreur par une convolution appropriée pour cette somme pondérée. En général, cela dépend de la forme de et il peut s'agir d'une distribution compliquée. Cependant, il convient de noter que si la distribution des erreurs n'est pas lourde et si pour que la décroissance soit lente, alors la distribution limite sera proche d'une distribution normale, en raison de l'approximation par la limite centrale théorème .F F α ≈ 1
Applications pratiques: dans la plupart des applications du processus de série chronologique AR ( ), nous supposons une distribution d'erreur normale , ce qui signifie que la distribution stationnaire du processus est :1 et∼ IID N ( 0 ,σ2)
Quelle que soit la distribution de départ du processus, cette distribution stationnaire est la distribution limite du processus. Si nous avons des raisons de croire que le processus fonctionne depuis un temps raisonnable, alors nous savons que le processus aura convergé vers cette distribution limite, il est donc logique de supposer que le processus suit cette distribution. Bien sûr, comme pour toute application de modélisation statistique, nous examinons des graphiques / tests de diagnostic pour voir si les données faussent notre forme de modèle supposée. Néanmoins, ce formulaire convient à une large classe de cas où le modèle AR ( ) est utilisé.1
Et si une distribution stationnaire n'existe pas: il existe certains processus de séries chronologiques où la distribution stationnaire n'existe pas. Ceci est plus courant lorsqu'il existe un aspect périodique fixe dans la série, ou un état absorbant (ou d'autres classes d'états non communicants). Dans ce cas, il peut ne pas y avoir de distribution limite, ou la distribution limite peut être une distribution marginale qui est agrégée entre plusieurs classes non communicantes, ce qui n'est pas du tout utile. Ce n'est pas intrinsèquement un problème - cela signifie simplement que vous avez besoin d'un autre type de modèle qui représente correctement la nature non stationnaire du processus. C'est plus compliqué, mais la théorie statistique a des moyens de traiter cela.
la source