J'ai deux séries chronologiques (paramètres d'un modèle pour hommes et femmes) et vise à identifier un modèle ARIMA approprié afin de faire des prévisions. Ma série chronologique ressemble à:
L'intrigue et l'ACF montrent non stationnaire (les pointes de l'ACF se coupent très lentement). Ainsi, j'utilise la différenciation et j'obtiens:
Ce graphique indique que la série pourrait maintenant être stationnaire et l'application du test kpss et du test adf corrobore cette hypothèse.
En commençant par la série Homme, nous faisons les observations suivantes:
- Les autocorrélations empiriques aux décalages 1, 4, 5, 26 et 27 sont significativement différentes de zéro.
- L'ACF coupe (?), Mais je suis préoccupé par les pics relativement importants des décalages 26 et 27.
- Seules les autocorrélations partielles empiriques aux décalages 1 et 2 sont significativement différentes de zéro.
Sur la base de ces seules observations, si je devais choisir un modèle AR ou MA pur pour la série chronologique différenciée, j'aurais tendance à choisir un modèle AR (2) en faisant valoir que:
- Nous n'avons pas d'autocorrélations partielles significatives pour un décalage supérieur à 2
- L'ACF s'arrête, sauf pour la région autour du décalage 27. (Ces quelques valeurs aberrantes sont-elles à elles seules un indicateur qu'un modèle ARMA mixte serait approprié?)
ou un modèle MA (1) en faisant valoir que:
- Le PACF coupe clairement
- Nous n'avons pour les retards supérieurs à 1 que 4 pointes dépassant la valeur critique en magnitude. Il s'agit "seulement" d'un de plus que des 3 pics (95% sur 60) qui seraient autorisés à se situer en dehors de la zone pointillée.
Il n'y a pas de caractéristique d'un modèle ARIMA (1,1,1) et le choix des ordres de p et q d'un modèle ARIMA sur la base de ACF et PACF pour p + q> 2 devient difficile.
L'utilisation de auto.arima () avec le critère AIC (Dois-je utiliser AIC ou AICC?) Donne:
- ARIMA (2,1,1) avec dérive; AIC = 280,2783
- ARIMA (0,1,1) avec dérive; AIC = 280,2784
- ARIMA (2,1,0) avec dérive; AIC = 281,437
Les trois modèles considérés montrent des résidus de bruit blanc:
Mes questions résumées sont:
- Pouvez-vous toujours décrire l'ACF de la série chronologique comme une coupure malgré les pointes autour du décalage 26?
- Ces valeurs aberrantes indiquent-elles qu'un modèle ARMA mixte pourrait être plus approprié?
- Quel critère d'information dois-je choisir? AIC? AICC?
- Les résidus des trois modèles avec l'AIC le plus élevé montrent tous un comportement de bruit blanc, mais la différence dans l'AIC n'est que très faible. Dois-je utiliser celui avec le moins de paramètres, c'est-à-dire un ARIMA (0,1,1)?
- Mon argumentation est-elle généralement plausible?
- Leurs autres possibilités sont-elles de déterminer quel modèle pourrait être le meilleur ou devrais-je, par exemple, les deux avec l'AIC le plus élevé et effectuer des backtests pour tester la plausibilité des prévisions?
EDIT: Voici mes données:
-5.9112948202 -5.3429985122 -4.7382340534 -3.1129015623 -3.0350910288 -2.3218904871 -1.7926701792 -1.1417358384 -0.6665592055 -0.2907748318 0.2899480865 0.4637205370 0.5826312749 0.3869227286 0.6268379174 0.7439125292 0.7641139207 0.7613140511 3.0143912244 -0.7339255839 2.0109976796 0.8282394650 -2.5668367983 5.9826406394 1.9569198553 2.3860893476 2.0883339390 1.9761894580 2.2601997245 2.2464027995 2.5131158613 3.4564765529 4.2307335557 4.0298688374 3.7626317439 3.1026407174 2.1690168737 1.5617407254 2.6790460788 0.4652054768 -0.0501046517 -1.0157683791 -0.5113698054 -0.0180401353 -1.9471272198 -0.2550365250 -1.1269988523 0.5152074134 0.2362626753 -2.9978337017 1.4924705528 -1.4907767844 -0.5492041416 -0.7313021018 -0.6531515868 -0.4094159299 -0.5525401626 -0.0611454515 -0.5256272882 -1.1235247363 -1.7299848758 -1.3807763611 -1.6999054476 -4.3155973110 -4.7843298990
la source