Ma lecture suggérée pour une introduction à la modélisation ARIMA serait
Analyse de séries chronologiques appliquées pour les sciences sociales 1980 par R McCleary; RA Hay; EE Meidinger; D McDowall
Ceci est destiné aux spécialistes des sciences sociales afin que les exigences mathématiques ne soient pas trop rigoureuses. Aussi pour des traitements plus courts, je suggérerais deux livres verts Sage (bien qu'ils soient entièrement redondants avec le livre McCleary),
Le texte Ostrom est uniquement une modélisation ARMA et ne traite pas des prévisions. Je ne pense pas non plus qu'ils satisferaient à votre exigence de représenter graphiquement l'erreur de prévision. Je suis sûr que vous pouvez également trouver des ressources plus utiles en examinant les questions marquées avec des séries chronologiques sur ce forum.
Je vais essayer de répondre à la douce pression de whuber de simplement «répondre à la question» et de rester sur le sujet. On nous donne 144 lectures mensuelles d'une série appelée «The Airline Series». Box et Jenkins ont été largement critiqués pour avoir fourni une prévision qui était extrêmement élevée en raison de la «nature explosive» d'une transformation inversée.
Visuellement on a l'impression que la variance de la série originale augmente avec le niveau de la série suggérant un besoin de transformation. Cependant, nous savons que l'une des exigences d'un modèle utile est que la variance des «erreurs de modèle» doit être homogène. Aucune hypothèse n'est nécessaire sur la variance de la série d'origine. Ils sont identiques si le modèle est simplement une constante c'est-à-dire y (t) = u. Comme /stats//users/2392/probabilityislogic l'a dit si clairement dans sa réponse aux conseils sur l'explication de l'hétérogénéité / hétéroscédastictie "une chose que je trouve toujours amusante est cette" non-normalité des données "qui inquiète les gens à propos. Les données n'ont pas besoin d'être distribuées normalement, mais le terme d'erreur le fait »
Les premiers travaux dans les séries chronologiques ont souvent tiré à tort des conclusions sur les transformations injustifiées. Nous découvrirons ici que la transformation corrective de ces données consiste simplement à ajouter trois séries factices indicatrices au modèle ARIMA reflétant un ajustement pour trois points de données inhabituels. Voici le tracé de la fonction d'autocorrélation suggérant une forte autocorrélation au décalage 12 (0,76) et au décalage 1 (0,948). Les autocorrélations sont simplement des coefficients de régression dans un modèle où y est la variable dépendante prédite par un décalage de y.
!
L'analyse ci-dessus suggère que l'on modélise les premières différences de la série et étudie cette «série résiduelle» qui est identique aux premières différences d'abord pour ses propriétés.
Cette analyse reconfirme l'idée qu'il existe un fort modèle saisonnier dans les données qui pourrait être corrigé ou modélisé par un modèle qui contenait deux opérateurs de différenciation.
Cette double différenciation simple produit un ensemble de résidus, c'est-à-dire une série ajustée ou, en gros, une série transformée qui met en évidence une variance non constante, mais la raison de la variance non constante est la moyenne non constante des résidus. séries doublement différenciées, suggérant trois anomalies à la fin de la série. L'autocorrélation de cette série indique à tort que «tout va bien» et qu'il pourrait être nécessaire de procéder à tout ajustement Ma (1). Des précautions doivent être prises car il y a une suggestion d'anomalies dans les données donc l'acf est biaisé vers le bas. C'est ce que l'on appelle «l'effet Alice au pays des merveilles», c'est-à-dire l'acceptation de l'hypothèse nulle de l'absence de structure évidente lorsque cette structure est masquée par une violation de l'une des hypothèses.
Nous détectons visuellement trois points inhabituels (117,135,136)
Cette étape de détection des valeurs aberrantes est appelée détection d'intervention et peut être facilement, ou pas si facilement, programmée en suivant le travail de Tsay.
Si nous ajoutons trois indicateurs au modèle, nous obtenons
On peut alors estimer
Et recevez un tracé des résidus et de l'acf
Cet acf suggère que nous ajoutons potentiellement deux coefficients de moyenne mobile au modèle. Ainsi, le prochain modèle estimé pourrait être.
Céder
On pourrait alors supprimer la constante non significative et obtenir un modèle affiné:
On note qu'aucune transformation de puissance n'a été nécessaire pour obtenir un ensemble de résidus à variance constante. Notez que les prévisions ne sont pas explosives.
En termes de somme pondérée simple, nous avons: 13 poids; 3 non nul et égal à (1.0.1,0., - 1,0)
Ce matériel a été présenté d'une manière qui n'était pas automatique et nécessitait par conséquent une interaction de l'utilisateur en termes de prise de décisions de modélisation.
la source
J'ai essayé de le faire dans le chapitre 7 de mon manuel de 1998 avec Makridakis & Wheelwright. Que j'ai réussi ou non, je laisserai les autres juger. Vous pouvez lire une partie du chapitre en ligne via Amazon (à partir de la p311). Recherchez «ARIMA» dans le livre pour persuader Amazon de vous montrer les pages pertinentes.
Mise à jour: j'ai un nouveau livre qui est gratuit et en ligne. Le chapitre ARIMA est ici .
la source
Je recommanderais la prévision avec la boîte univariée - modèles Jenkins: concepts et cas par Alan Pankratz. Ce livre classique possède toutes les fonctionnalités que vous avez demandées:
Le seul inconvénient est qu'il a été imprimé en 1983 et pourrait ne pas avoir de développements récents. L'éditeur arrive avec une 2e édition en janvier 2014 avec des mises à jour.
la source
Un modèle ARIMA est simplement une moyenne pondérée. Il répond à la double question;
et
Il répond à la prière de la jeune fille pour déterminer comment s'adapter aux valeurs précédentes (et aux valeurs précédentes SEUL) afin de projeter la série (qui est vraiment causée par des variables causales non spécifiées) Ainsi, un modèle ARIMA est un modèle causal d'un pauvre.
la source