La procédure de sélection du modèle de Box-Jenkins dans l'analyse des séries chronologiques commence par examiner les fonctions d'autocorrélation et d'autocorrélation partielle de la série. Ces graphiques peuvent suggérer les et q appropriés dans un modèle ARMA ( p , q ) . La procédure se poursuit en demandant à l'utilisateur d'appliquer les critères AIC / BIC pour sélectionner le modèle le plus parcimonieux parmi ceux qui produisent un modèle avec un terme d'erreur de bruit blanc.
Je me demandais comment ces étapes d'inspection visuelle et de sélection de modèle basée sur des critères affectaient les erreurs-types estimées du modèle final. Je sais que de nombreuses procédures de recherche dans un domaine transversal peuvent biaiser les erreurs standard vers le bas, par exemple.
À la première étape, comment la sélection du nombre approprié de retards en examinant les données (ACF / PACF) a-t-elle un impact sur les erreurs standard des modèles de séries chronologiques?
Je suppose que la sélection du modèle sur la base des scores AIC / BIC aurait un impact analogue à celui des méthodes transversales. En fait, je ne connais pas grand-chose non plus dans ce domaine, donc tout commentaire serait également apprécié sur ce point.
Enfin, si vous notiez le critère précis utilisé pour chaque étape, pourriez-vous amorcer l'ensemble du processus pour estimer les erreurs types et éliminer ces préoccupations?
Réponses:
Toute procédure de sélection de modèle affectera les erreurs standard et cela n'est presque jamais pris en compte. Par exemple, les intervalles de prédiction sont calculés conditionnellement sur le modèle estimé et l'estimation des paramètres et la sélection du modèle sont généralement ignorées.
Il devrait être possible d'amorcer l'ensemble de la procédure afin d'estimer l'effet du processus de sélection du modèle. Mais rappelez-vous que l'amorçage de séries temporelles est plus délicat que l'amorçage normal car vous devez préserver la corrélation série. Le bootstrap de bloc est une approche possible même s'il perd une certaine corrélation série en raison de la structure du bloc.
la source
À mon avis, la sélection du nombre approprié de décalages n'est pas différente de la sélection du nombre de séries d'entrée dans une procédure de régression pas à pas. L'importance incrémentielle des décalages ou d'une série d'entrée spécifique est la base de la spécification provisoire du modèle.
Puisque vous avez affirmé que l'acf / pacf est la seule base pour la sélection du modèle Box-Jenkins, permettez-moi de vous dire ce que l'expérience m'a appris. Si une série présente un acf qui ne se désintègre pas, l'approche de Box-Jenkins (vers 1965) suggère de différencier les données. Mais si une série a un changement de niveau, comme les données du Nil , alors la non-stationnarité "visuellement apparente" est un symptôme de la structure nécessaire mais la différenciation n'est pas le remède. Cet ensemble de données du Nil peut être modélisé sans différenciation en identifiant simplement la nécessité d'un changement de niveau en premier. Dans la même veine, on nous enseigne en utilisant les concepts de 1960 que si l'acf présente une structure saisonnière ( c.-à-d.des valeurs significatives à des décalages de s, 2s, 3s, ...) alors nous devrions incorporer une composante saisonnière ARIMA. Aux fins de discussion, considérons une série qui est stationnaire autour d'une moyenne et à intervalles fixes, par exemple chaque mois de juin il y a une "valeur élevée". Cette série est correctement traitée en incorporant une série factice "à l'ancienne" de 0 et de 1 (en juin) afin de traiter la structure saisonnière. Un modèle ARIMA saisonnier utiliserait de façon incorrecte la mémoire au lieu d'une variable X non spécifiée mais en attente d'être trouvée. Ces deux concepts d'identification / d'incorporation d'une structure déterministe non spécifiée sont des applications directes des travaux de I. Chang, William Bell, George Tiao, R. Tsay , Chen et al (à partir de 1978) sous le concept général de détection d'intervention.
Même aujourd'hui, certains analystes exécutent sans réfléchir des stratégies de maximisation de la mémoire, les appelant ARIMA automatique, sans reconnaître que la "modélisation de mémoire sans esprit" suppose que la structure déterministe telle que les impulsions, les changements de niveau, les impulsions saisonnières et les tendances de l'heure locale sont inexistantes ou pires encore mais ne jouent pas rôle dans l'identification des modèles. Cela revient à mettre sa tête dans le sable, à mon humble avis.
la source