La méthodologie Box-Jenkins est une stratégie ou une procédure qui peut être utilisée pour construire un modèle ARIMA. La méthodologie est décrite dans le livre Time Series Analysis: Forecasting and Control de George EP Box et Gwilym M. Jenkins, publié à l'origine en 1970 - des éditions plus récentes existent.
En ouvrant SAS, en appelant proc ARIMA et en fournissant des numéros pour p, d et q, vous avez simplement estimé un modèle ARIMA. Faire cela aveuglément, c'est-à-dire en n'utilisant aucune méthodologie particulière reconnue pour identifier le modèle ARIMA lui-même, c'est un peu comme jouer avec des allumettes - les dangers du logiciel!
Si vous continuez à répéter ce processus - en estimant beaucoup et beaucoup de modèles ARIMA - vous pourrez éventuellement sélectionner un modèle avec le critère d'information Akaike le plus bas (parmi l'ensemble de modèles que vous avez estimé). Dans ce contexte, une approche plus systématique serait d'utiliser un algorithme basé sur la comparaison des valeurs AIC pour une variété de modèles différents pour sélectionner automatiquement un modèle ARIMA pour vous, tel que celui fourni par le package de prévision dans R - le nom de la fonction pertinente est auto.arima()
.
Quoi qu'il en soit, la procédure que vous avez décrite impliquait de sélectionner un modèle ARIMA basé sur la minimisation de certains critères d'information (dans ce cas, l'AIC, mais il existe d'autres mesures). C'est une méthodologie particulière, mais ce n'est pas la méthodologie de Box-Jenkins; une alternative.
La méthodologie Box-Jenkins comprend cinq étapes (bien que l'on dit parfois qu'elle ne comporte que trois étapes):
- Vérifier la stationnarité ou la non-stationnarité et transformer les données, si nécessaire;
- Identification d'un modèle ARMA approprié;
- Estimation des paramètres du modèle choisi;
- Vérification diagnostique de l'adéquation du modèle; et
- Prévision ou répétition des étapes deux à cinq.
Il s'agit notamment d'un processus itératif qui implique que le constructeur de modèles exerce un certain jugement - et c'est un aspect de la méthodologie qui a été considéré comme une lacune. La partie de jugement entre en jeu notamment lors de l'interprétation de deux outils; à savoir, la fonction d'autocorrélation (estimée) (ACF) et la fonction d'autocorrélation partielle (PACF).
Si vous souhaitez devenir un praticien de la méthodologie Box-Jenkins, je vous recommande de consulter le texte original (vous seriez surpris de ce que les manuels modernes omettent!) À côté des variations modernes que vous pouvez trouver. Alan Pankratz a quelques excellents manuels, que je recommanderais également fortement; par exemple, Prévision avec des modèles Box-Jenkins univariés: concepts et cas .
L'expérience me suggère que le terme "méthodologie de Box-Jenkins" est utilisé de manière lâche parce que j'ai entendu certaines personnes l'utiliser pour se référer simplement à la construction de modèles ARIMA en général - et non au processus réel impliqué dans la construction d'un modèle ARIMA - tandis que d'autres l'utilisent pour se référer à une version modifiée de ce qui a été publié en 1970. Comme l'a souligné @Glen_b, "il existe de nombreux documents qui décrivent la méthodologie de Box-Jenkins de nos jours qui incluraient l'utilisation d'AIC ou de quantités similaires" .
Q: Êtes-vous censé utiliser la méthodologie de Box-Jenkins pour arriver à des estimations initiales de p, d, q?
Comme déjà mentionné, il existe différentes stratégies de sélection de modèles, la réponse est non, ce n'est pas nécessairement le cas si vous devez utiliser la méthodologie Box-Jenkins, mais vous le pourriez si vous le vouliez.
Q: SAS l'a-t-il utilisé en interne d'une manière ou d'une autre?
Très peu probable à moins que ce logiciel n'offre une fonction assez sophistiquée! Consultez la documentation officielle de SAS pour plus de détails sur ce que le logiciel fait ou est capable de faire. Si c'était R, vous pourriez regarder le code source, mais je doute que ce soit une option avec SAS.