Je travaille sur un ensemble de données. Après avoir utilisé certaines techniques d'identification de modèle, je suis sorti avec un modèle ARIMA (0,2,1).
J'ai utilisé la detectIO
fonction dans le package TSA
en R pour détecter une valeur aberrante innovante (IO) à la 48e observation de mon ensemble de données d'origine.
Comment puis-je intégrer cette valeur aberrante dans mon modèle afin de pouvoir l'utiliser à des fins de prévision? Je ne veux pas utiliser le modèle ARIMAX car je ne pourrais peut-être pas faire de prédictions à partir de cela dans R. Y a-t-il d'autres façons de le faire?
Voici mes valeurs dans l'ordre:
VALUE <- scan()
4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4
5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0
9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 9.5 9.5 9.5 9.5 9.8 9.3 9.1 9.0 8.9
9.0 9.0 9.1 9.0 9.0 9.0 8.9 8.6 8.5 8.3 8.3 8.2 8.1 8.2 8.2 8.2 8.1
7.8 7.9 7.8 7.8
Ce sont en fait mes données. Ce sont des taux de chômage sur une période de 6 ans. Il y a alors 72 observations. Chaque valeur doit contenir au plus une décimale
la source
Réponses:
De cette façon, vous pouvez voir que l'impact de l'anomalie est non seulement instantané mais a de la mémoire.
Chaque fois que vous intégrez de la mémoire, que ce soit le résultat d'un opérateur de différenciation ou d'une structure ARMA, il s'agit d'un aveu tacite d'ignorance en raison de séries causales omises. Cela est également vrai de la nécessité d'incorporer des séries déterministes d'intervention telles que les impulsions / changements de niveau, les impulsions saisonnières ou les tendances de l'heure locale. Ces variables factices sont un proxy nécessaire pour les variables causales déterministes omises déterminées par l'utilisateur. Souvent, tout ce que vous avez est la série d'intérêt et, compte tenu des qualificatifs que j'ai énoncés, vous pouvez prévoir l'avenir en fonction du passé, dans l'ignorance totale de la nature exacte des données analysées. Le seul problème est que vous utilisez la lunette arrière pour prédire la route à venir ... une chose dangereuse en effet.
après la publication des données ...
Un modèle raisonnable est un (1,1,0) is et les anomalies AO ont été identifiées aux périodes 39,41,47,21 et 69 (pas à la période 48). Les résidus de ce modèle semblent être exempts de structure évidente. ET Le fice AO évalue une représentation optimale de l'activité reflétée par l'activité qui n'est pas dans l'histoire de la série chronologique. Je pense que l'ACF du modèle surdifférencié du PO refléterait l'inadéquation du modèle. Voici le modèle. Là encore, aucun code R n'est fourni car le problème ou l'opportunité se situe dans le domaine de l'identification / révision / validation du modèle. Enfin un tracé de la série réelle / ajustée et prévue.! [Entrez la description de l'image ici] [6]
la source