Chris Chatfield, dont j'ai apprécié la lecture de nombreux livres et articles de qualité, dans (1) donne les conseils suivants:
Par exemple, le choix entre les modèles de séries chronologiques ARIMA avec des valeurs AIC faibles et approximativement égales devrait probablement être fait, non pas sur celui qui donne l'AIC minimum, mais sur celui qui donne les meilleures prévisions des données de l'année la plus récente.
Quelle est la justification de ces conseils? S'il est solide, pourquoi est-ce que Forecast :: auto.arima et d'autres routines de prévision ne le suivent pas? Reste à mettre en œuvre? Il a déjà été discuté ici que rechercher des modèles qui venaient juste de donner l'AIC minimum n'est probablement pas une bonne idée. Pourquoi l'option d'avoir modèles ARIMA avec des valeurs faibles mais approximativement égales (par exemple à 1 ou 2 valeurs de l'AIC minimal) n'est-elle pas une valeur par défaut dans la plupart des logiciels de prévision de séries chronologiques?
(1) Chatfield, C. (1991). Éviter les pièges statistiques. Science statistique, 6 (3), 240–252. Disponible en ligne, URL: https://projecteuclid.org/euclid.ss/1177011686 .
la source
Réponses:
Il est vrai que si vous avez plusieurs valeurs AIC approximativement égales, la sélection de la valeur la plus basse peut ne pas être la meilleure option. Une alternative judicieuse serait d'effectuer la moyenne du modèle. De cette façon, vous pouvez utiliser non seulement le meilleur modèle pour l'inférence, mais un ensemble de modèles "les plus pris en charge", chacun pondéré en fonction de leur valeur AIC.
Vous avez une courte introduction de Vincent Calcagno ici
la source