Explication / motivation intuitive de la distribution stationnaire d'un processus

Souvent, dans la littérature, les auteurs se sont intéressés à trouver la distribution stationnaire d'un processus de séries chronologiques. Par exemple, considérons le processus AR ( ) simple suivant : où . $1$ $\{X_t\}$

X_{t} = α X_{t - 1} + e_{t},

$X_t = \alpha X_{t-1} + e_t,$

e_{t} \overset{i i d}{\sim} f

$e_t\stackrel{iid}{\thicksim} f$

Quelle pourrait être la ou les motivations pour trouver la distribution stationnaire de tout processus stochastique?

Quelles autres analyses (théoriques et pratiques) pourrait-on faire en utilisant la distribution stationnaire résultante?

Quel (s) est (sont) le (s) problème (s) si la distribution stationnaire n'existe pas? Le processus deviendra-t-il inutile?

Et si la distribution stationnaire existe mais qu'elle n'a pas de forme fermée? Quels sont les inconvénients de ne pas avoir une expression sous forme fermée de la même chose?

distributions markov-process stationarity autoregressive intuition Shanks
la source

Dans une certaine mesure, je pense que nous sommes intéressés par la distribution stationnaire d'un processus AR pour la même raison que nous sommes intéressés par la distribution d'un processus iid. À condition que la distribution stationnaire existe, c'est alors la distribution marginale de , qui nous indique sa moyenne et sa variance ou intervalle de confiance en général. En effet, je ne m'intéresse qu'au processus stationnaire de covariance, car avec le CLT, je connais la distribution asymptotique tant que je connais la moyenne et la variance.

X_{t}

$X_{t}$

semibruin

Il existe diverses motivations à s'intéresser aux distributions stationnaires dans ce contexte, mais l'aspect le plus important est probablement qu'elles sont étroitement liées à la limitation des distributions. Pour la plupart des processus chronologiques, il existe un lien étroit entre la distribution stationnaire et la distribution limite du processus. Dans des conditions très larges, les processus de séries chronologiques basés sur des termes d'erreur IID ont une distribution stationnaire, et ils convergent vers cette distribution stationnaire en tant que distribution limite pour toute distribution de départ que vous spécifiez. Cela signifie que si vous laissez le processus s'exécuter pendant une longue période, sa distribution sera proche de la distribution stationnaire, quelle que soit la façon dont il a commencé. Ainsi, si vous avez des raisons de croire que le processus est en cours depuis longtemps,

Dans votre question, vous utilisez l'exemple d'un processus de série chronologique AR ( ) avec des termes d'erreur IID avec une distribution marginale arbitraire. Si alors ce modèle est une chaîne de Markov récurrente homogène dans le temps et sa distribution stationnaire peut être trouvée en l'inversant dans un processus MA ( ): $1$ $|\alpha|<1$ $\infty$

X_{t} = \sum_{k = 0}^{\infty} α^{k} e_{t - k} e_{t} \sim IID F .

$X_t = \sum_{k=0}^\infty \alpha^{k} e_{t-k} \quad \quad \quad e_t \sim \text{IID }f.$

Nous pouvons voir que le processus est une somme pondérée d'une chaîne infinie de termes d'erreur IID, où les pondérations sont en décomposition exponentielle. La distribution limite peut être obtenue à partir de la distribution d'erreur par une convolution appropriée pour cette somme pondérée. En général, cela dépend de la forme de et il peut s'agir d'une distribution compliquée. Cependant, il convient de noter que si la distribution des erreurs n'est pas lourde et si pour que la décroissance soit lente, alors la distribution limite sera proche d'une distribution normale, en raison de l'approximation par la limite centrale théorème . $f$ $f$ $\alpha \approx 1$

Applications pratiques: dans la plupart des applications du processus de série chronologique AR ( ), nous supposons une distribution d'erreur normale , ce qui signifie que la distribution stationnaire du processus est : $1$ $e_t \sim \text{IID N}(0, \sigma^2)$

X_{t} \sim N (0, \frac{σ^{2}}{1 - α^{2}}) .

$X_t \sim \text{N} \Big( 0, \frac{\sigma^2}{1-\alpha^2} \Big).$

Quelle que soit la distribution de départ du processus, cette distribution stationnaire est la distribution limite du processus. Si nous avons des raisons de croire que le processus fonctionne depuis un temps raisonnable, alors nous savons que le processus aura convergé vers cette distribution limite, il est donc logique de supposer que le processus suit cette distribution. Bien sûr, comme pour toute application de modélisation statistique, nous examinons des graphiques / tests de diagnostic pour voir si les données faussent notre forme de modèle supposée. Néanmoins, ce formulaire convient à une large classe de cas où le modèle AR ( ) est utilisé. $1$

Et si une distribution stationnaire n'existe pas: il existe certains processus de séries chronologiques où la distribution stationnaire n'existe pas. Ceci est plus courant lorsqu'il existe un aspect périodique fixe dans la série, ou un état absorbant (ou d'autres classes d'états non communicants). Dans ce cas, il peut ne pas y avoir de distribution limite, ou la distribution limite peut être une distribution marginale qui est agrégée entre plusieurs classes non communicantes, ce qui n'est pas du tout utile. Ce n'est pas intrinsèquement un problème - cela signifie simplement que vous avez besoin d'un autre type de modèle qui représente correctement la nature non stationnaire du processus. C'est plus compliqué, mais la théorie statistique a des moyens de traiter cela.

Ben - Réintègre Monica
la source

Merci beaucoup, @Ben pour la réponse. Cela efface certains de mes doutes. Vous avez dit que la distribution stationnaire peut être utilisée dans diverses applications statistiques. Est-ce à dire que la distribution stationnaire est utile si seulement elle a une forme fermée? Si vous clarifiez un peu plus ce qui se passera si la distribution stationnaire existe mais n'a pas de forme explicite?

Shanks

Le cas habituel est de supposer une distribution normale pour les termes d'erreur, ce qui conduit alors à une distribution stationnaire normalement distribuée pour le processus. Cela présente également l'avantage d'être la distribution formée à partir du CLT. Dans le cas où vous utilisez un modèle avec une distribution stationnaire qui n'est pas sous forme fermée, vous pouvez le simuler ou faire une approximation en utilisant des mélanges de distributions normales. Il est rare de voir quelqu'un utiliser un processus qui n'est pas normal.

Ben - Réintègre Monica

Je pense que la distribution stationnaire devient non normale si on complique un peu la fonction autorégressive, disons

X_{t} = α X_{t - 1}^{2} + e_{t}

$X_t = \alpha X_{t-1}^2 + e_t$ ou

X_{t} = α | X_{t - 1} | + e_{t}

$X_t = \alpha |X_{t-1}| + e_t$ .

Shanks

Vous avez maintenant un formulaire de modèle différent, et donc une question différente.

Ben - Réintègre Monica

Explication / motivation intuitive de la distribution stationnaire d'un processus

Réponses: