J'ai une question sur les modèles ARIMA. Disons que j'ai une série temporelle que je voudrais prévoir et qu'un modèle ARIMA ( 2 , 2 ) semble être un bon moyen de mener l'exercice de prévision. Δ Y t = α 1 Δ Y t - 1 + α 2 Δ Y t - 2 + ν t + θ 1 ν t - 1 + θ 2 ν t - 2
Maintenant, les décalés impliquent que ma série d'aujourd'hui est influencée par des événements antérieurs. C'est logique. Mais quelle est l'interprétation des erreurs? Mon résidu antérieur (à quel point j'étais dans mon calcul) influence la valeur de ma série aujourd'hui? Comment les résidus décalés sont-ils calculés dans cette régression, car il s'agit du produit / reste de la régression?
regression
time-series
interpretation
Gabriel
la source
la source
Réponses:
Je pense que vous devez vous rappeler que les modèles ARIMA sont des modèles athéoriques , donc l'approche habituelle pour interpréter les coefficients de régression estimés ne s'applique pas vraiment à la modélisation ARIMA.
Afin d'interpréter (ou de comprendre) les modèles ARIMA estimés, il serait bon de connaître les différentes caractéristiques affichées par un certain nombre de modèles ARIMA courants.
Nous pouvons explorer certaines de ces caractéristiques en étudiant les types de prévisions produites par différents modèles ARIMA. C'est l'approche principale que j'ai adoptée ci-dessous, mais une bonne alternative serait d'examiner les fonctions de réponse impulsionnelle ou les chemins temporels dynamiques associés à différents modèles ARIMA (ou équations aux différences stochastiques). J'en parlerai à la fin.
Modèles AR (1)
Considérons un modèle AR (1) pendant un moment. Dans ce modèle, nous pouvons dire que plus la valeur de est faible, plus le taux de convergence (vers la moyenne) est rapide. Nous pouvons essayer de comprendre cet aspect des modèles AR (1) en étudiant la nature des prévisions pour un petit ensemble de modèles AR (1) simulés avec des valeurs différentes pour αα1 α1
L'ensemble des quatre modèles AR (1) dont nous discuterons peut être écrit en notation algébrique comme:
Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.
Modèles MA (1)
Dans le graphique ci-dessous, j'ai tracé des prévisions hors échantillon pour ces quatre modèles MA (1) différents. Comme le montre le graphique, le comportement des prévisions dans les quatre cas est sensiblement similaire; convergence rapide (linéaire) vers la moyenne. Notez qu'il y a moins de variété dans la dynamique de ces prévisions par rapport à celles des modèles AR (1).
Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.
Modèles AR (2)
Les choses deviennent beaucoup plus intéressantes lorsque nous commençons à envisager des modèles ARIMA plus complexes. Prenons par exemple les modèles AR (2). Ce ne sont qu'un petit pas en avant par rapport au modèle AR (1), non? Eh bien, on pourrait penser cela, mais la dynamique des modèles AR (2) est assez riche en variété comme nous le verrons dans un instant.
Explorons quatre modèles AR (2) différents:
Les prévisions hors échantillon associées à chacun de ces modèles sont présentées dans le graphique ci-dessous. Il est assez clair qu'ils diffèrent chacun de manière significative et ils sont également assez variés par rapport aux prévisions que nous avons vues ci-dessus - à l'exception des prévisions du modèle 2 (graphique en haut à droite) qui se comportent de manière similaire à celles d'un AR (1) modèle.
Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.
Il convient de noter que la condition ci-dessus provient de la solution générale à la forme homogène de l'équation de différence linéaire, autonome et de second ordre (avec des racines complexes). Si cela vous est étranger, je recommande à la fois le chapitre 1 de Hamilton (1994) et le chapitre 20 de Hoy et al. (2001).
Comme prévu par l'apparition des prévisions tracées, la condition est remplie pour chacun des quatre modèles, sauf pour le modèle 2. Rappelons sur le graphique que les prévisions du modèle 2 se comportent ("normalement") de manière similaire aux prévisions d'un modèle AR (1). Les prévisions associées aux autres modèles contiennent des cycles.
Application - Modélisation de l'inflation
Ce sont les types de questions que nous pouvons poser en essayant d'interpréter un modèle AR (2) et comme vous pouvez le voir, ce n'est pas aussi simple que de prendre un coefficient estimé et de dire "une augmentation de 1 unité de cette variable est associée à un si- de nombreuses unités augmentent dans la variable dépendante " - en veillant bien sûr à associer la condition ceteris paribus à cette déclaration.
Gardez à l'esprit que dans notre discussion jusqu'à présent, nous n'avons exploré qu'une sélection de modèles AR (1), MA (1) et AR (2). Nous n'avons même pas examiné la dynamique des modèles ARMA mixtes et des modèles ARIMA impliquant des retards plus élevés.
Dites ce que vous voulez, mais ici, il vaut mieux essayer de comprendre la dynamique du système lui-même. Comme précédemment, nous pouvons regarder et voir quel type de prévisions produit le modèle, mais l'approche alternative que j'ai mentionnée au début de cette réponse était d'examiner la fonction de réponse impulsionnelle ou le trajet temporel associé au système.
Cela m'amène à la partie suivante de ma réponse où nous discuterons des fonctions de réponse impulsionnelle.
Fonctions de réponse impulsionnelle
Ceux qui sont familiers avec les autorégressions vectorielles (VAR) seront conscients que l'on essaie généralement de comprendre le modèle VAR estimé en interprétant les fonctions de réponse impulsionnelle; plutôt que d'essayer d'interpréter les coefficients estimés qui sont souvent trop difficiles à interpréter de toute façon.
La même approche peut être adoptée en essayant de comprendre les modèles ARIMA. Autrement dit, plutôt que d'essayer de donner un sens à des déclarations (compliquées) comme "l'inflation d'aujourd'hui dépend de l'inflation d'hier et de l'inflation d'il y a deux mois, mais pas de l'inflation de la semaine dernière!" , nous traçons plutôt la fonction de réponse impulsionnelle et essayons de donner un sens à cela.
Application - Quatre variables macro
Les équations montrent que la croissance du PIB, le taux de chômage et le taux d'intérêt à court terme sont modélisés comme des processus AR (2) tandis que l'inflation est modélisée comme un processus AR (4).
Plutôt que d'essayer d'interpréter les coefficients dans chaque équation, traçons les fonctions de réponse impulsionnelle (IRF) et interprétons-les à la place. Le graphique ci-dessous montre les fonctions de réponse impulsionnelle associées à chacun de ces modèles.
Ne prenez pas cela comme une masterclass dans l'interprétation des IRF - pensez plutôt à une introduction de base - mais de toute façon, pour nous aider à interpréter les IRF, nous devrons nous habituer à deux concepts; élan et persévérance .
Ces deux concepts sont définis dans Leamer (2010) comme suit:
Munis de ces connaissances, nous posons maintenant la question: supposons qu'une variable soit à sa moyenne historique et qu'elle subisse un choc temporaire d'une unité sur une seule période, comment la variable va-t-elle réagir dans les périodes futures? Cela revient à poser les questions que nous avons posées auparavant, par exemple: les prévisions contiennent-elles des cycles? , à quelle vitesse les prévisions convergent-elles vers la moyenne? , etc.
Nous pouvons enfin tenter d'interpréter les IRF.
Après un choc d'une unité, le taux de chômage et le taux d'intérêt à court terme (trésorerie à 3 mois) sont éloignés de leur moyenne historique. C'est l'effet de l'élan. Les FRI montrent également que le taux de chômage dépasse largement le taux d'intérêt à court terme.
Nous constatons également que toutes les variables reviennent à leurs moyennes historiques (aucune ne «saute»), bien qu'elles le fassent chacune à des rythmes différents. Par exemple, la croissance du PIB revient à sa moyenne historique après environ 6 périodes après un choc, le taux de chômage revient à sa moyenne historique après environ 18 périodes, mais l'inflation et les intérêts à court terme mettent plus de 20 périodes pour revenir à leurs moyennes historiques. En ce sens, la croissance du PIB est la moins persistante des quatre variables tandis que l'inflation peut être considérée comme très persistante.
Je pense que c'est une conclusion juste de dire que nous avons réussi (au moins partiellement) à donner un sens à ce que les quatre modèles ARIMA nous disent à propos de chacune des quatre macro-variables.
Conclusion
Plutôt que d'essayer d'interpréter les coefficients estimés dans les modèles ARIMA (difficile pour de nombreux modèles), essayez plutôt de comprendre la dynamique du système. Nous pouvons tenter cela en explorant les prévisions produites par notre modèle et en traçant la fonction de réponse impulsionnelle.
[Je suis assez heureux de partager mon code R si quelqu'un le veut.]
Les références
la source
on peut dire que les termes d'erreur dans les modèles ARMA expliquent l'influence "à court terme" du passé, et les termes décalés expliquent l'influence "à long terme". Cela dit, je ne pense pas que cela aide beaucoup et généralement personne ne se soucie de l'interprétation précise des coefficients ARMA. Le but est généralement d'obtenir un modèle adéquat et de l'utiliser pour la prévision.
la source
De cette façon, un modèle ARIMA peut être expliqué comme la réponse à la question
la source