Comment comparer les modèles sur la base de l'AIC?

13

Nous avons deux modèles qui utilisent la même méthode pour calculer la vraisemblance logarithmique et l'AIC pour l'un est inférieur à l'autre. Cependant, celui avec l'AIC inférieur est beaucoup plus difficile à interpréter.

Nous avons du mal à décider si cela vaut la peine d'introduire la difficulté et nous avons jugé cela en utilisant un pourcentage de différence dans l'AIC. Nous avons constaté que la différence entre les deux AIC n'était que de 0,7%, le modèle plus compliqué ayant un AIC de 0,7% inférieur.

  1. La faible différence en pourcentage entre les deux est-elle une bonne raison pour éviter d'utiliser le modèle avec l'AIC inférieur?

  2. Le pourcentage de différence explique-t-il que 0,7% d'informations supplémentaires sont perdues dans le modèle moins compliqué?

  3. Les deux modèles peuvent-ils avoir des résultats très différents?

Ali Turab Lotia
la source
Duplication possible de Qu'est
Arun Jose
2
@ArunJose, il ne semble pas s'agir d'un doublon. Les questions ici sont très différentes.
Richard Hardy
1
Non. Cette question ne concerne pas la comparabilité des modèles. Nous savons déjà que les modèles sont comparables. Cette question concerne ce qui compte comme une différence significative dans l'AIC et le compromis entre la complexité et l'ajustement du modèle.
Ali Turab Lotia

Réponses:

25

On ne compare pas les valeurs absolues de deux AIC (qui peuvent être comme mais aussi 1000000 ), mais considère leur différence : Δ i = A I C i - A I C m i n , où est l'AIC du ème modèle et est le AIC le plus bas obtenu parmi l'ensemble des modèles examinés (c'est-à-dire le modèle préféré). La règle d'or, décrite par exemple dans Burnham & Anderson 2004 , est la suivante:1001000000

Δi=AICiAICmin,
i A I C m i nAICiiAICmin
  1. si , alors il y a un support substantiel pour le ème modèle (ou les preuves contre lui ne valent qu'une simple mention), et la proposition qu'il s'agit d'une description correcte est hautement probable;iΔi<2i
  2. 2<Δi<4i
  3. 4<Δi<7i
  4. Δi>10

Maintenant, concernant les 0,7% mentionnés dans la question, considérons deux situations:

  1. AIC1=AICmin=100AIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000AIC2AIC2=100700Δ2=70010

Par conséquent, dire que la différence entre les AIC est de 0,7% ne fournit aucune information.

LΔiΔi=AICiAICminAICmin:=0

La formulation de l'AIC pénalise l'utilisation d'un nombre excessif de paramètres, décourageant ainsi le surajustement. Il préfère les modèles avec moins de paramètres, tant que les autres n'offrent pas un ajustement sensiblement meilleur. L'AIC essaie de sélectionner un modèle (parmi ceux examinés) qui décrit le mieux la réalité (sous la forme des données examinées). Cela signifie qu'en fait le modèle étant une véritable description des données n'est jamais considéré. Notez que l'AIC vous donne les informations dont le modèle décrit mieux les données, il ne donne aucune interprétation .

ΔiΔi<2Δi<5

i

pi=exp(Δi2),

AICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

Enfin, concernant la formule AIC:

AIC=2k2L,

LΔi2kΔi2Δk<1

TL; DR

  1. C'est une mauvaise raison; utiliser la différence entre les valeurs absolues des AIC.
  2. Le pourcentage ne dit rien.
  3. Impossible de répondre à cette question en raison de l'absence d'informations sur les modèles, les données et la signification des différents résultats .
corey979
la source
1
C'est l'explication la plus claire que j'ai jamais vue de cette mystérieuse affaire. J'ai recherché l'article auquel vous avez fait référence (pp. 270-272) et votre explication ici est une représentation simple et claire mais très précise de ce que l'article explique.
Tripartio
Pourriez-vous peut-être aider avec cette question de suivi? stats.stackexchange.com/questions/349883/…
Tripartio