J'ai du mal à distinguer les concepts de scédasticité et de stationnarité. Si je comprends bien, l'hétéroscédasticité correspond à des variabilités différentes dans les sous-populations et la non-stationnarité est une moyenne / variance changeante au fil du temps.
S'il s'agit d'une compréhension correcte (quoique simpliste), la non-stationnarité est-elle simplement un cas spécifique d'hétéroscédasticité dans le temps?
Réponses:
Pour donner des définitions précises, soit des variables aléatoires à valeur réelle.X1, … , Xn
La stationnarité n'est généralement définie que si l'on considère l'indice des variables comme le temps . Dans ce cas, la séquence de variables aléatoires est stationnaire de a la même distribution que . Cela implique, en particulier, que pour ont tous la même distribution marginale et donc la même moyenne marginale et la même variance (étant donné qu'ils ont un second moment fini).X1, … , Xn - 1 X2, … , Xn Xje i = 1 , … , n
La signification de l' hétéroscédasticité peut dépendre du contexte. Si les variances marginales des changent avec (même si la moyenne est constante) les variables aléatoires sont dites hétéroscédastiques dans le sens où elles ne sont pas homoscédastiques.Xje je
Dans l'analyse de régression, nous considérons généralement la variance de la réponse conditionnellement sur les régresseurs, et nous définissons l'hétéroscédasticité comme une variance conditionnelle non constante.
Dans l'analyse de séries chronologiques, où la terminologie hétéroscédasticité conditionnelle est courante, l'intérêt est généralement dans la variance de conditionnellement sur . Si cette variance conditionnelle n'est pas constante, nous avons une hétéroscédasticité conditionnelle. Le modèle ARCH (hétéroscédasticité conditionnelle autorégressive) est l'exemple le plus célèbre d'un modèle de série chronologique stationnaire avec variance conditionnelle non constante.Xk Xk - 1, … , X1
L'hétéroscédasticité (hétéroscédasticité conditionnelle en particulier) n'implique pas la non-stationnarité en général.
La stationnarité est importante pour plusieurs raisons. Une conséquence statistique simple est que la moyenne est alors un estimateur sans biais de l'espérance (et en supposant l' ergodicité , qui est légèrement plus que la stationnarité et souvent supposée implicitement, la moyenne est un estimateur cohérent de l'espérance pour ).
L'importance de l'hétéroscédasticité (ou homoscédasticité) est, d'un point de vue statistique, liée à l'évaluation de l'incertitude statistique, par exemple le calcul des intervalles de confiance. Si les calculs sont effectués sous l'hypothèse d'homoscédasticité alors que les données montrent effectivement une hétéroscédasticité, les intervalles de confiance qui en résultent peuvent être trompeurs.
la source
Une série chronologique est stationnaire si toutes ses propriétés statistiques ne dépendent pas de l'origine temporelle. Si cette exigence n'est pas remplie, la série chronologique n'est pas stationnaire.
Même une série chronologique stationnaire ne peut pas être décrite sur la base d'un seul enregistrement d'échantillon. Ses propriétés statistiques doivent être analysées en faisant la moyenne de l'ensemble des enregistrements d'échantillons à différentes origines temporelles.
Si les propriétés statistiques sont les mêmes pour tout enregistrement d'échantillon individuel et pour le cas où elles sont déterminées par la moyenne d'ensemble, la série chronologique est ergodique.
Comme les propriétés statistiques d'une série temporelle hétéroscédactique dépendent du temps, elle n'est pas stationnaire et, bien sûr, non ergodique. Ses propriétés déterminées pour un seul enregistrement d'échantillon ne peuvent pas être étendues à son comportement passé et futur.
Soit dit en passant, l'analyse de corrélation / régression ne peut pas être appliquée aux séries chronologiques car la dépendance entre elles (la fonction de cohérence) dépend de la fréquence et peut être caractérisée par des équations d'équations aux différences stochastiques (multivariées) (domaine temporel) ou par la ou les fonctions de réponse en fréquence. (domaine fréquentiel).
L'extension de l'analyse de régression développée pour les variables aléatoires aux séries chronologiques est erronée (par exemple, voir Bendat et Piersol, 2010; Box et al., 2015).
la source
Il y a 3 degrés de stationnaire. La forme faible nécessite une moyenne et la variance est maintenue constante. Cela signifie que sur 3 définitions stationnaires, les exigences sont plus fortes que l'hétéroscédasticité car l'hétéroscédasticité signifie une variance constante, sans référence à la moyenne.
Un processus peut avoir une hétéroscédasticité. Mais si sa moyenne n'est pas constante, alors le processus n'est pas (faiblement) stationnaire.
Un processus stationnaire (notons-le par «S») implique une homoscédasticité (notons-le par «H»). Donc S -> H.
Naturellement, sa contraposition est également vraie . Donc H '-> S', c'est-à-dire que la non-homoscédasticité implique non stationnaire.
Mais l' inversion et la négation ne sont pas vraies . En d'autres termes:
"Non stationnaire implique non-homoscédasticité" n'est pas vrai.
"Il existe un processus stationnaire qui est la non-homoscédasticité" n'est pas vrai.
la source