Contexte: Remarque: mon ensemble de données et mon code r sont inclus sous le texte
Je souhaite utiliser AIC pour comparer deux modèles d'effets mixtes générés à l'aide du package lme4 dans R. Chaque modèle a un effet fixe et un effet aléatoire. L'effet fixe diffère selon les modèles, mais l'effet aléatoire reste le même entre les modèles. J'ai trouvé que si j'utilise REML = T, model2 a le score AIC le plus bas, mais si j'utilise REML = F, model1 a le score AIC le plus bas.
Prise en charge de l'utilisation de ML:
Zuur et al. (2009; PAGE 122) suggèrent que "Pour comparer des modèles avec des effets fixes imbriqués (mais avec la même structure aléatoire), l'estimation ML doit être utilisée et non REML." Cela m'indique que je devrais utiliser ML car mes effets aléatoires sont les mêmes dans les deux modèles, mais mes effets fixes diffèrent. [Zuur et al. 2009. Modèles à effets mixtes et extensions en écologie avec R. Springer.]
Prise en charge de l'utilisation de REML:
Cependant, je remarque que lorsque j'utilise ML, la variance résiduelle associée aux effets aléatoires diffère entre les deux modèles (modèle1 = 136,3; modèle2 = 112,9), mais lorsque j'utilise REML, c'est la même entre les modèles (modèle1 = modèle2 = 151,5). Cela implique pour moi que je devrais plutôt utiliser REML pour que la variance résiduelle aléatoire reste la même entre les modèles avec la même variable aléatoire.
Question:
N'est-il pas plus logique d'utiliser REML que ML pour des comparaisons de modèles où les effets fixes changent et les effets aléatoires restent les mêmes? Sinon, pouvez-vous expliquer pourquoi ou m'indiquer d'autres documents qui en expliquent davantage?
# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)
# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)
Base de données:
Response Fixed1 Fixed2 Random1
5.20 A A 1
32.50 A A 1
6.57 A A 2
24.77 A B 3
41.69 A B 3
34.29 A B 4
1.80 A B 4
10.00 A B 5
15.56 A B 5
4.44 A C 6
21.65 A C 6
9.20 A C 7
4.11 A C 7
12.52 B D 8
0.25 B D 8
27.34 B D 9
11.54 B E 10
0.86 B E 10
0.68 B E 11
4.00 B E 11
la source
Réponses:
Zuur et al., Et Faraway (du commentaire de @ janhove ci-dessus) ont raison; L'utilisation de méthodes basées sur la vraisemblance (y compris l'AIC) pour comparer deux modèles avec des effets fixes différents qui sont ajustés par REML conduira généralement à un non-sens.
la source
C'est un exemple de pourquoi REML ne devrait pas être utilisé lors de la comparaison de modèles avec différents effets fixes. REML, cependant, estime souvent mieux les paramètres des effets aléatoires et il est donc parfois recommandé d'utiliser ML pour les comparaisons et REML pour estimer un modèle unique (peut-être final).
la source