Penser à utiliser des réseaux de neurones récurrents pour la prévision de séries chronologiques. Ils implémentent essentiellement une sorte d'auto-régression non linéaire généralisée, par rapport aux modèles ARMA et ARIMA qui utilisent l'auto-régression linéaire.
Si nous effectuons une auto-régression non linéaire, est-il toujours nécessaire que les séries chronologiques soient stationnaires et aurions-nous besoin d'effectuer une différenciation comme nous le faisons dans les modèles ARIMA?
Ou le caractère non linéaire du modèle lui donne-t-il la capacité de gérer des séries chronologiques non stationnaires?
Pour poser la question d'une autre manière: l'exigence de stationnarité (dans la moyenne et la variance) pour les modèles ARMA et ARIMA est-elle due au fait que ces modèles sont linéaires, ou est-ce à cause d'autre chose?
la source
Réponses:
Si le but de votre modèle est la prédiction et la prévision, la réponse courte est OUI, mais la stationnarité n'a pas besoin d'être sur des niveaux.
Je vais t'expliquer. Si vous ramenez les prévisions à leur forme la plus élémentaire, ce sera l'extraction de l'invariant. Considérez ceci: vous ne pouvez pas prévoir ce qui change. Si je vous dis que demain sera différent de celui d'aujourd'hui dans tous les aspects imaginables , vous ne pourrez pas produire de prévisions .
Ce n'est que lorsque vous pouvez étendre quelque chose d'aujourd'hui à demain que vous pouvez produire n'importe quel type de prédiction. Je vais vous donner quelques exemples.
Dans tous les cas de prévisions raisonnables, nous extrayons d'abord quelque chose de constant du processus et l'étendons à l'avenir. Par conséquent, ma réponse: oui, les séries chronologiques doivent être stationnaires si la variance et la moyenne sont les invariants que vous allez étendre dans le futur à partir de l'histoire. De plus, vous voulez que les relations avec les régresseurs soient également stables.
Identifiez simplement ce qui est un invariant dans votre modèle, que ce soit un niveau moyen, un taux de changement ou autre chose. Ces choses doivent rester les mêmes à l'avenir si vous voulez que votre modèle ait une puissance de prévision.
Exemple Holt Winters
Le filtre Holt Winters a été mentionné dans les commentaires. C'est un choix populaire pour lisser et prévoir certains types de séries saisonnières, et il peut traiter des séries non stationnaires. En particulier, il peut gérer des séries où le niveau moyen augmente linéairement avec le temps. En d'autres termes où la pente est stable . Dans ma terminologie, la pente est l'un des invariants que cette approche extrait de la série. Voyons comment cela échoue lorsque la pente est instable.
Dans ce graphique, je montre la série déterministe avec une croissance exponentielle et une saisonnalité additive. En d'autres termes, la pente ne cesse de s'accentuer avec le temps:
Vous pouvez voir comment le filtre semble très bien correspondre aux données. La ligne ajustée est rouge. Cependant, si vous essayez de prédire avec ce filtre, il échoue lamentablement. La vraie ligne est noire et le rouge s'il est équipé de limites de confiance bleues sur le graphique suivant:
La raison pour laquelle il échoue est facile à voir en examinant équations du modèle Holt Winters . Il extrait la pente du passé et s'étend au futur. Cela fonctionne très bien lorsque la pente est stable, mais lorsqu'il augmente constamment, le filtre ne peut pas suivre, c'est un pas en arrière et l'effet s'accumule dans une erreur de prévision croissante.
Code R:
Dans cet exemple, vous pourrez peut-être améliorer les performances du filtre en prenant simplement un journal de séries. Lorsque vous prenez un logarithme de séries à croissance exponentielle, vous stabilisez à nouveau sa pente et donnez une chance à ce filtre. Voici un exemple:
Code R:
la source
Je suis également d'accord avec @Aksakal, que si l'objectif principal est de prédire, les caractéristiques cardinales d'une série stationnaire doivent être respectées.
la source