Que dois-je faire lorsque les valeurs de l'AIC sont faibles et approximativement égales?

11

Chris Chatfield, dont j'ai apprécié la lecture de nombreux livres et articles de qualité, dans (1) donne les conseils suivants:

Par exemple, le choix entre les modèles de séries chronologiques ARIMA avec des valeurs AIC faibles et approximativement égales devrait probablement être fait, non pas sur celui qui donne l'AIC minimum, mais sur celui qui donne les meilleures prévisions des données de l'année la plus récente.

Quelle est la justification de ces conseils? S'il est solide, pourquoi est-ce que Forecast :: auto.arima et d'autres routines de prévision ne le suivent pas? Reste à mettre en œuvre? Il a déjà été discuté ici que rechercher des modèles qui venaient juste de donner l'AIC minimum n'est probablement pas une bonne idée. Pourquoi l'option d'avoir n1 modèles ARIMA avec des valeurs faibles mais approximativement égales (par exemple à 1 ou 2 valeurs de l'AIC minimal) n'est-elle pas une valeur par défaut dans la plupart des logiciels de prévision de séries chronologiques?

(1) Chatfield, C. (1991). Éviter les pièges statistiques. Science statistique, 6 (3), 240–252. Disponible en ligne, URL: https://projecteuclid.org/euclid.ss/1177011686 .

Hibernation
la source
@Gleb_b "Un AIC est seulement haut ou bas par rapport à un autre." - Comment penser différemment quand on parle de sélection de modèle? Nous regardons toujours les valeurs faibles plutôt que les valeurs supérieures. Quel est le problème avec ma quatrième phrase? Je pense qu'il indique assez clairement que nous parlons de différences (par exemple au sein d'un ou deux de l'AIC minimum). Il n'y a aucune mention des valeurs absolues de l'AIC dans la question.
Hibernation le
J'ai supprimé "low" du titre et de la première phrase de la boîte, pour les raisons que @hibernating a indiquées.
Harvey Motulsky
@Harvey Motulsky Veuillez remettre "bas" aux deux endroits. Je vous remercie.
Hibernation
Votre question est de savoir comment comparer les modèles avec les AIC dont les valeurs sont assez proches les unes des autres. Élevé ou bas n'est pas pertinent (et peut changer simplement en changeant les unités dans lesquelles les données sont exprimées). Alors pourquoi remettre ces mots? Ils sont trompeurs.
Harvey Motulsky
1
@Harvey Motulsky S'il vous plaît laissez-moi être moi-même. J'aime le titre actuel et mon titre d'origine "Que dois-je faire lorsque les valeurs d'AIC sont faibles et approximativement égales?" J'ai tendance à préférer «sélectionner» à «choisir» dans mes statistiques. J'ai un certain nombre d'autres préférences qui me caractérisent en tant qu'individu et qui se reflètent dans la façon dont je formule mes questions et réponses. Je suis heureux que vous ayez finalement compris pourquoi je vous ai demandé de revenir sur les modifications. Pas de problème.
Hibernation

Réponses:

2

Il est vrai que si vous avez plusieurs valeurs AIC approximativement égales, la sélection de la valeur la plus basse peut ne pas être la meilleure option. Une alternative judicieuse serait d'effectuer la moyenne du modèle. De cette façon, vous pouvez utiliser non seulement le meilleur modèle pour l'inférence, mais un ensemble de modèles "les plus pris en charge", chacun pondéré en fonction de leur valeur AIC.

Vous avez une courte introduction de Vincent Calcagno ici

Aghila
la source