Interprétation du modèle ARIMA

Je pense que vous devez vous rappeler que les modèles ARIMA sont des modèles athéoriques , donc l'approche habituelle pour interpréter les coefficients de régression estimés ne s'applique pas vraiment à la modélisation ARIMA.

Afin d'interpréter (ou de comprendre) les modèles ARIMA estimés, il serait bon de connaître les différentes caractéristiques affichées par un certain nombre de modèles ARIMA courants.

Nous pouvons explorer certaines de ces caractéristiques en étudiant les types de prévisions produites par différents modèles ARIMA. C'est l'approche principale que j'ai adoptée ci-dessous, mais une bonne alternative serait d'examiner les fonctions de réponse impulsionnelle ou les chemins temporels dynamiques associés à différents modèles ARIMA (ou équations aux différences stochastiques). J'en parlerai à la fin.

Modèles AR (1)

Considérons un modèle AR (1) pendant un moment. Dans ce modèle, nous pouvons dire que plus la valeur de est faible, plus le taux de convergence (vers la moyenne) est rapide. Nous pouvons essayer de comprendre cet aspect des modèles AR (1) en étudiant la nature des prévisions pour un petit ensemble de modèles AR (1) simulés avec des valeurs différentes pour $\alpha_{1}$ $\alpha_{1}$

L'ensemble des quatre modèles AR (1) dont nous discuterons peut être écrit en notation algébrique comme:

{Oui}_{t} = C + 0,95 {Oui}_{t - 1} + ν_{t} (1) {Oui}_{t} = C + 0,8 {Oui}_{t - 1} + ν_{t} (2) {Oui}_{t} = C + 0,5 {Oui}_{t - 1} + ν_{t} (3) {Oui}_{t} = C + 0,4 {Oui}_{t - 1} + ν_{t} (4)

$\begin{equation} Y_{t} = C + 0.95 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (1)\\ Y_{t} = C + 0.8 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (2)\\ Y_{t} = C + 0.5 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (3)\\ Y_{t} = C + 0.4 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (4) \end{equation}$

C

$C$

α_{1}

$\alpha_{1}$

$\alpha_{1} = 0.95$ $\alpha_{1} = 0.4$

entrez la description de l'image ici

Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.

Modèles MA (1)

$\theta_{1}$

{Oui}_{t} = C + 0,95 ν_{t - 1} + ν_{t} (5) {Oui}_{t} = C + 0,8 ν_{t - 1} + ν_{t} (6) {Oui}_{t} = C + 0,5 ν_{t - 1} + ν_{t} (sept) {Oui}_{t} = C + 0,4 ν_{t - 1} + ν_{t} (8)

$\begin{equation} Y_{t} = C + 0.95 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (5)\\ Y_{t} = C + 0.8 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (6)\\ Y_{t} = C + 0.5 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (7)\\ Y_{t} = C + 0.4 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (8) \end{equation}$

Dans le graphique ci-dessous, j'ai tracé des prévisions hors échantillon pour ces quatre modèles MA (1) différents. Comme le montre le graphique, le comportement des prévisions dans les quatre cas est sensiblement similaire; convergence rapide (linéaire) vers la moyenne. Notez qu'il y a moins de variété dans la dynamique de ces prévisions par rapport à celles des modèles AR (1).

entrez la description de l'image ici

Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.

Modèles AR (2)

Les choses deviennent beaucoup plus intéressantes lorsque nous commençons à envisager des modèles ARIMA plus complexes. Prenons par exemple les modèles AR (2). Ce ne sont qu'un petit pas en avant par rapport au modèle AR (1), non? Eh bien, on pourrait penser cela, mais la dynamique des modèles AR (2) est assez riche en variété comme nous le verrons dans un instant.

Explorons quatre modèles AR (2) différents:

{Oui}_{t} = C + 1,7 {Oui}_{t - 1} - 0,8 {Oui}_{t - 2} + ν_{t} (9) {Oui}_{t} = C + 0,9 {Oui}_{t - 1} - 0,2 {Oui}_{t - 2} + ν_{t} (dix) {Oui}_{t} = C + 0,5 {Oui}_{t - 1} - 0,2 {Oui}_{t - 2} + ν_{t} (11) {Oui}_{t} = C + 0,1 {Oui}_{t - 1} - 0,7 {Oui}_{t - 2} + ν_{t} (12)

$\begin{equation} Y_{t} = C + 1.7 Y_{t-1} -0.8 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (9)\\ Y_{t} = C + 0.9 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (10)\\ Y_{t} = C + 0.5 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (11)\\ Y_{t} = C + 0.1 Y_{t-1} -0.7 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (12) \end{equation}$

Les prévisions hors échantillon associées à chacun de ces modèles sont présentées dans le graphique ci-dessous. Il est assez clair qu'ils diffèrent chacun de manière significative et ils sont également assez variés par rapport aux prévisions que nous avons vues ci-dessus - à l'exception des prévisions du modèle 2 (graphique en haut à droite) qui se comportent de manière similaire à celles d'un AR (1) modèle.

entrez la description de l'image ici

Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.

α_{1}^{2} + 4 α_{2} < 0,

$\begin{equation} \alpha_{1}^{2}+4\alpha_{2} < 0, \end{equation}$

Il convient de noter que la condition ci-dessus provient de la solution générale à la forme homogène de l'équation de différence linéaire, autonome et de second ordre (avec des racines complexes). Si cela vous est étranger, je recommande à la fois le chapitre 1 de Hamilton (1994) et le chapitre 20 de Hoy et al. (2001).

(1,7)^{2} + 4 (- 0,8) = - 0,31 < 0 (13) (0,9)^{2} + 4 (- 0,2) = 0,01 > 0 (14) (0,5)^{2} + 4 (- 0,2) = - 0,55 < 0 (15) (0,1)^{2} + 4 (- 0,7) = - 2,54 < 0 (16)

$\begin{equation} (1.7)^{2} + 4 (-0.8) = -0.31 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (13)\\ (0.9)^{2} + 4 (-0.2) = 0.01 > 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (14)\\ (0.5)^{2} + 4 (-0.2) = -0.55 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (15)\\ (0.1)^{2} + 4 (-0.7) = -2.54 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (16) \end{equation}$

Comme prévu par l'apparition des prévisions tracées, la condition est remplie pour chacun des quatre modèles, sauf pour le modèle 2. Rappelons sur le graphique que les prévisions du modèle 2 se comportent ("normalement") de manière similaire aux prévisions d'un modèle AR (1). Les prévisions associées aux autres modèles contiennent des cycles.

Application - Modélisation de l'inflation

$\pi_{t}$

π_{t} = C + α_{1} π_{t - 1} + α_{2} π_{t - 2} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{2} \pi_{t-2} + \nu_{t}. \end{equation}$ . Maintenant, je ne m'opposerais pas à une telle interprétation, mais je suggère de faire preuve de prudence et de creuser un peu plus pour trouver une interprétation correcte. Dans ce cas, nous pourrions demander, de quelle manière l'inflation est-elle liée aux niveaux d'inflation précédents? Y a-t-il des cycles? Si oui, combien de cycles y a-t-il? Peut-on dire quelque chose sur le pic et le creux? À quelle vitesse les prévisions convergent-elles vers la moyenne? Etc.

Ce sont les types de questions que nous pouvons poser en essayant d'interpréter un modèle AR (2) et comme vous pouvez le voir, ce n'est pas aussi simple que de prendre un coefficient estimé et de dire "une augmentation de 1 unité de cette variable est associée à un si- de nombreuses unités augmentent dans la variable dépendante " - en veillant bien sûr à associer la condition ceteris paribus à cette déclaration.

Gardez à l'esprit que dans notre discussion jusqu'à présent, nous n'avons exploré qu'une sélection de modèles AR (1), MA (1) et AR (2). Nous n'avons même pas examiné la dynamique des modèles ARMA mixtes et des modèles ARIMA impliquant des retards plus élevés.

$\alpha_{2}$

π_{t} = C + α_{1} π_{t - 1} + α_{3} π_{t - 3} + θ_{1} ν_{t - 1} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{3} \pi_{t-3} + \theta_{1}\nu_{t-1} + \nu_{t}. \end{equation}$

Dites ce que vous voulez, mais ici, il vaut mieux essayer de comprendre la dynamique du système lui-même. Comme précédemment, nous pouvons regarder et voir quel type de prévisions produit le modèle, mais l'approche alternative que j'ai mentionnée au début de cette réponse était d'examiner la fonction de réponse impulsionnelle ou le trajet temporel associé au système.

Cela m'amène à la partie suivante de ma réponse où nous discuterons des fonctions de réponse impulsionnelle.

Fonctions de réponse impulsionnelle

Ceux qui sont familiers avec les autorégressions vectorielles (VAR) seront conscients que l'on essaie généralement de comprendre le modèle VAR estimé en interprétant les fonctions de réponse impulsionnelle; plutôt que d'essayer d'interpréter les coefficients estimés qui sont souvent trop difficiles à interpréter de toute façon.

La même approche peut être adoptée en essayant de comprendre les modèles ARIMA. Autrement dit, plutôt que d'essayer de donner un sens à des déclarations (compliquées) comme "l'inflation d'aujourd'hui dépend de l'inflation d'hier et de l'inflation d'il y a deux mois, mais pas de l'inflation de la semaine dernière!" , nous traçons plutôt la fonction de réponse impulsionnelle et essayons de donner un sens à cela.

Application - Quatre variables macro

\begin{array}{rcl} {Oui}_{t} & = & 3,20 + 0,22 {Oui}_{t - 1} + 0,15 {Oui}_{t - 2} + ν_{t} \\ π_{t} & = & 4.10 + 0,46 π_{t - 1} + 0,31 π_{t - 2} + 0,16 π_{t - 3} + 0,01 π_{t - 4} + ν_{t} \\ u_{t} & = & 6.2 + 1,58 u_{t - 1} - 0,64 u_{t - 2} + ν_{t} \\ r_{t} & = & 6.0 + 1,18 r_{t - 1} - 0,23 r_{t - 2} + ν_{t} \end{array}

$\begin{eqnarray} Y_{t} &=& 3.20 + 0.22 Y_{t-1} + 0.15 Y_{t-2} + \nu_{t}\\ \pi_{t} &=& 4.10 + 0.46 \pi_{t-1} + 0.31\pi_{t-2} + 0.16\pi_{t-3} + 0.01\pi_{t-4} + \nu_{t}\\ u_{t} &=& 6.2+ 1.58 u_{t-1} - 0.64 u_{t-2} + \nu_{t}\\ r_{t} &=& 6.0 + 1.18 r_{t-1} - 0.23 r_{t-2} + \nu_{t} \end{eqnarray}$

Y_{t}

$Y_{t}$

t

$t$

π

$\pi$

u

$u$

r

$r$

Les équations montrent que la croissance du PIB, le taux de chômage et le taux d'intérêt à court terme sont modélisés comme des processus AR (2) tandis que l'inflation est modélisée comme un processus AR (4).

Plutôt que d'essayer d'interpréter les coefficients dans chaque équation, traçons les fonctions de réponse impulsionnelle (IRF) et interprétons-les à la place. Le graphique ci-dessous montre les fonctions de réponse impulsionnelle associées à chacun de ces modèles.

entrez la description de l'image ici

Ne prenez pas cela comme une masterclass dans l'interprétation des IRF - pensez plutôt à une introduction de base - mais de toute façon, pour nous aider à interpréter les IRF, nous devrons nous habituer à deux concepts; élan et persévérance .

Ces deux concepts sont définis dans Leamer (2010) comme suit:

Momentum : Momentum est la tendance à continuer de se déplacer dans la même direction. L'effet de quantité de mouvement peut compenser la force de régression (convergence) vers la moyenne et peut permettre à une variable de s'éloigner de sa moyenne historique, pendant un certain temps, mais pas indéfiniment.

Persistance : une variable de persistance restera là où elle se trouve et ne convergera lentement que vers la moyenne historique.

Munis de ces connaissances, nous posons maintenant la question: supposons qu'une variable soit à sa moyenne historique et qu'elle subisse un choc temporaire d'une unité sur une seule période, comment la variable va-t-elle réagir dans les périodes futures? Cela revient à poser les questions que nous avons posées auparavant, par exemple: les prévisions contiennent-elles des cycles? , à quelle vitesse les prévisions convergent-elles vers la moyenne? , etc.

Nous pouvons enfin tenter d'interpréter les IRF.

Après un choc d'une unité, le taux de chômage et le taux d'intérêt à court terme (trésorerie à 3 mois) sont éloignés de leur moyenne historique. C'est l'effet de l'élan. Les FRI montrent également que le taux de chômage dépasse largement le taux d'intérêt à court terme.

Nous constatons également que toutes les variables reviennent à leurs moyennes historiques (aucune ne «saute»), bien qu'elles le fassent chacune à des rythmes différents. Par exemple, la croissance du PIB revient à sa moyenne historique après environ 6 périodes après un choc, le taux de chômage revient à sa moyenne historique après environ 18 périodes, mais l'inflation et les intérêts à court terme mettent plus de 20 périodes pour revenir à leurs moyennes historiques. En ce sens, la croissance du PIB est la moins persistante des quatre variables tandis que l'inflation peut être considérée comme très persistante.

Je pense que c'est une conclusion juste de dire que nous avons réussi (au moins partiellement) à donner un sens à ce que les quatre modèles ARIMA nous disent à propos de chacune des quatre macro-variables.

Conclusion

Plutôt que d'essayer d'interpréter les coefficients estimés dans les modèles ARIMA (difficile pour de nombreux modèles), essayez plutôt de comprendre la dynamique du système. Nous pouvons tenter cela en explorant les prévisions produites par notre modèle et en traçant la fonction de réponse impulsionnelle.

[Je suis assez heureux de partager mon code R si quelqu'un le veut.]

Les références

Hamilton, JD (1994). Analyse des séries chronologiques (Vol.2). Princeton: Presse universitaire de Princeton.
Leamer, E. (2010). Modèles macroéconomiques et histoires - Un guide pour les MBA, Springer.
Stengos, T., M. Hoy, J. Livernois, C. McKenna et R. Rees (2001). Mathematics for Economics, 2e édition, MIT Press: Cambridge, MA.

Graeme Walsh
la source

J'adore l'application de l'IRF aux non-VAR. Ils semblent toujours être associés et je n'avais jamais pensé à utiliser des IRF sur de simples ARIMA. (Ce plus, qui peut vraiment comprendre ce que font les termes MA?)

Wayne

Quelle bonne réponse!

Richard Hardy

Interprétation du modèle ARIMA

Réponses: