Nous avons deux modèles qui utilisent la même méthode pour calculer la vraisemblance logarithmique et l'AIC pour l'un est inférieur à l'autre. Cependant, celui avec l'AIC inférieur est beaucoup plus difficile à interpréter.
Nous avons du mal à décider si cela vaut la peine d'introduire la difficulté et nous avons jugé cela en utilisant un pourcentage de différence dans l'AIC. Nous avons constaté que la différence entre les deux AIC n'était que de 0,7%, le modèle plus compliqué ayant un AIC de 0,7% inférieur.
La faible différence en pourcentage entre les deux est-elle une bonne raison pour éviter d'utiliser le modèle avec l'AIC inférieur?
Le pourcentage de différence explique-t-il que 0,7% d'informations supplémentaires sont perdues dans le modèle moins compliqué?
Les deux modèles peuvent-ils avoir des résultats très différents?
la source
Réponses:
On ne compare pas les valeurs absolues de deux AIC (qui peuvent être comme mais aussi ∼ 1000000 ), mais considère leur différence : Δ i = A I C i - A I C m i n , où est l'AIC du ème modèle et est le AIC le plus bas obtenu parmi l'ensemble des modèles examinés (c'est-à-dire le modèle préféré). La règle d'or, décrite par exemple dans Burnham & Anderson 2004 , est la suivante:∼ 100 ∼ 1000000
Maintenant, concernant les 0,7% mentionnés dans la question, considérons deux situations:
Par conséquent, dire que la différence entre les AIC est de 0,7% ne fournit aucune information.
La formulation de l'AIC pénalise l'utilisation d'un nombre excessif de paramètres, décourageant ainsi le surajustement. Il préfère les modèles avec moins de paramètres, tant que les autres n'offrent pas un ajustement sensiblement meilleur. L'AIC essaie de sélectionner un modèle (parmi ceux examinés) qui décrit le mieux la réalité (sous la forme des données examinées). Cela signifie qu'en fait le modèle étant une véritable description des données n'est jamais considéré. Notez que l'AIC vous donne les informations dont le modèle décrit mieux les données, il ne donne aucune interprétation .
Enfin, concernant la formule AIC:
TL; DR
la source