Comment faire une série temporelle stationnaire?

42

Outre les différences, quelles sont les autres techniques permettant de créer une série temporelle non stationnaire, stationnaire?

Habituellement, on parle de série " intégrée d’ordre p " si elle peut être rendue fixe par l’intermédiaire d’un opérateur de décalage .(1L)PXt

Shane
la source

Réponses:

18

Déconnecter est fondamental. Cela inclut la régression contre les covariables autres que le temps.

La désaisonnalisation est une version de la prise de différences mais peut être interprétée comme une technique séparée.

La transformation des données convertit implicitement un opérateur de différence en quelque chose d'autre; Par exemple, les différences entre les logarithmes sont en fait des ratios.

Certaines techniques de lissage des EDA (telles que le retrait d'une médiane en mouvement) pourraient être interprétées comme des méthodes non paramétriques de réduction des tendances. Tukey les a utilisés tels quels dans son livre sur l'EDA. Tukey a continué en détournant les résidus et en répétant ce processus aussi longtemps que nécessaire (jusqu'à ce qu'il obtienne des résidus apparaissant stationnaires et distribués symétriquement autour de zéro).

whuber
la source
pouvez-vous expliquer plus en détail comment les tendances sont faites? Comment supprimer l'impact des covariables par régression? Si je suis correct, il ne sera applicable que pour les séries chronologiques à plusieurs variables.
Arpit Sisodia
1
@Arpit Vous remplacez les données d'origine par leurs résidus dans les régressions par rapport aux covariables. Cela s'applique aux séries chronologiques univariées ainsi qu'aux séries chronologiques multivariées. Ceci est expliqué plus en détail et illustré à l' adresse stats.stackexchange.com/a/113207/919 et à stats.stackexchange.com/a/46508/919 .
whuber
@ Whuber Ne pensez-vous pas que la régression contre les covariables (qui peuvent être non stationnaires) nous expose au problème de la régression fausse?
Vishaal Sudarsan
10

Je pense toujours que l’utilisation du pourcentage de changement d’une période à l’autre est la meilleure façon de rendre une variable non stationnaire stationnaire, comme vous le suggérez d’abord. Une transformation telle qu'une bûche fonctionne relativement bien (elle aplatit la qualité non stationnaire; elle ne l'élimine pas entièrement).

La troisième méthode consiste à désaisaliser et décomposer les données simultanément dans une seule régression linéaire. Une variable indépendante serait la tendance (ou le temps): 1, 2, 3, ... en combien de temps. Et, l'autre variable serait une variable catégorique avec 11 catégories différentes (pour 11 des 12 mois). Ensuite, en utilisant le coefficient résultant de cette régression, vous pouvez simultanément détourner et diminuer la saisonnalité des données. Vous verrez l'ensemble de votre ensemble de données essentiellement aplati. Les différences restantes entre les périodes refléteront des changements indépendants de la tendance de la croissance et de la saison.

Sympa
la source
pouvez-vous expliquer le coefficient un peu plus élaboré pour les débutants? Je pense que votre approche vaut la peine d’être essayée, car si j’ai constaté des différences dans mon cas (taux de croissance), la tendance s’aplatit, mais la saisonnalité s’est renforcée. L’approche simulatène semble donc valoir la peine d’être essayée. Mais que fais-je avec les deux coefficients? en particulier, je veux dire les nuls ...
hans0l0
ran2, je sais que ce n'est peut-être pas si clair, mais je ne peux pas l'expliquer autant mieux que ce que j'ai déjà fait. C'est le reflet de mes propres compétences en communication plus que tout. Au lieu de cela, je suggérerais le correctif de base qui fonctionne le plus souvent. C’est simplement pour changer votre variable de série temporelle nominale en% de changement d’une période à l’autre, etc. En se concentrant sur le pourcentage de changement plutôt que sur les valeurs nominales, une variable non stationnaire est immédiatement transformée en une variable stationnaire que vous pouvez ensuite facilement régresser.
Sympa
7

Les logs et les inverses et autres transformations de puissance donnent souvent des résultats inattendus.

En ce qui concerne les résidus nuisibles (c.-à-d. Tukey), cela peut avoir une application dans certains cas mais peut être dangereux. D'autre part, la détection des changements de niveau et des changements de tendance est systématiquement disponible pour les chercheurs utilisant des méthodes de détection d'intervention. Étant donné qu'un décalage de niveau est la différence d'une tendance temporelle tout comme une impulsion est la différence d'un décalage de niveau, les méthodes utilisées par Ruey Tsay sont facilement couvertes par ce problème.

Si une série présente des décalages de niveau (c.-à-d. Un changement d'interception), le remède approprié pour stabiliser la série consiste à "rabaisser" la série. Box-Jenkins a commis une erreur critique en supposant que le remède à la non-stationnarité consistait à différencier les opérateurs. Ainsi, parfois, la différenciation est appropriée et d'autres fois, l'ajustement pour le décalage moyen "s" est approprié. Dans les deux cas, la fonction d'autocorrélation peut présenter une non-stationnarité. Ceci est un symptôme de l'état de la série (c'est-à-dire stationnaire ou non stationnaire). Dans le cas d'une non-stationnarité évidente, les causes peuvent être différentes. Par exemple, la série a vraiment une moyenne variable continue ou la série a eu un changement temporaire de la moyenne.

L’approche suggérée a été proposée pour la première fois par Tsay en 1982 et a été ajoutée à certains logiciels. Les chercheurs devraient se reporter à l'article de "Tsay" du journal de prévision intitulé "Valeurs éloignées, changements de niveau et variations de variance dans les séries chronologiques", Journal of Forecasting, vol. 7, I-20 (1988).

Comme d'habitude, les manuels sont lents à incorporer une technologie de pointe, mais ce matériau peut être référencé dans le livre de Wei (c.-à-d. Time Series Analysis), Delurgio et Makradakis couvrent les interventions incorporantes, mais ne permettent pas de détecter comme le fait le texte de Wei.

Tom Reilly
la source
4

Différence avec une autre série. C'est-à-dire que les prix du pétrole Brent ne sont pas stationnaires, mais que le brut doux doux Brent-Light est répandu. Une proposition plus risquée pour la prévision consiste à parier sur l'existence d'une relation de co-intégration avec une autre série chronologique.

utilisateur603
la source
4

Pourriez-vous adapter un loess / spline aux données et utiliser les résidus? Les résidus seraient-ils stationnaires?

Cela semble être semé d'embûches, et peut-être qu'il n'y aurait pas d'indication aussi claire d'une courbe trop souple que celle d'une différenciation excessive.

Wayne
la source
+1 pour indiquer la solution qui est évidente et pourtant largement sous-discutée. Chaque méthode est semée d'embûches, mais le lissage non paramétrique est fondamental et il convient de bien explorer le lien entre toutes les autres méthodes de détournement proposées et celle-ci. Serait heureux d'entendre parler de sources pertinentes ...
zkurtz