REML ou ML pour comparer deux modèles d'effets mixtes avec des effets fixes différents, mais avec le même effet aléatoire?

18

Contexte: Remarque: mon ensemble de données et mon code r sont inclus sous le texte

Je souhaite utiliser AIC pour comparer deux modèles d'effets mixtes générés à l'aide du package lme4 dans R. Chaque modèle a un effet fixe et un effet aléatoire. L'effet fixe diffère selon les modèles, mais l'effet aléatoire reste le même entre les modèles. J'ai trouvé que si j'utilise REML = T, model2 a le score AIC le plus bas, mais si j'utilise REML = F, model1 a le score AIC le plus bas.

Prise en charge de l'utilisation de ML:

Zuur et al. (2009; PAGE 122) suggèrent que "Pour comparer des modèles avec des effets fixes imbriqués (mais avec la même structure aléatoire), l'estimation ML doit être utilisée et non REML." Cela m'indique que je devrais utiliser ML car mes effets aléatoires sont les mêmes dans les deux modèles, mais mes effets fixes diffèrent. [Zuur et al. 2009. Modèles à effets mixtes et extensions en écologie avec R. Springer.]

Prise en charge de l'utilisation de REML:

Cependant, je remarque que lorsque j'utilise ML, la variance résiduelle associée aux effets aléatoires diffère entre les deux modèles (modèle1 = 136,3; modèle2 = 112,9), mais lorsque j'utilise REML, c'est la même entre les modèles (modèle1 = modèle2 = 151,5). Cela implique pour moi que je devrais plutôt utiliser REML pour que la variance résiduelle aléatoire reste la même entre les modèles avec la même variable aléatoire.

Question:

N'est-il pas plus logique d'utiliser REML que ML pour des comparaisons de modèles où les effets fixes changent et les effets aléatoires restent les mêmes? Sinon, pouvez-vous expliquer pourquoi ou m'indiquer d'autres documents qui en expliquent davantage?

# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)

# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)

Base de données:

Response    Fixed1  Fixed2  Random1
5.20    A   A   1
32.50   A   A   1
6.57    A   A   2
24.77   A   B   3
41.69   A   B   3
34.29   A   B   4
1.80    A   B   4
10.00   A   B   5
15.56   A   B   5
4.44    A   C   6
21.65   A   C   6
9.20    A   C   7
4.11    A   C   7
12.52   B   D   8
0.25    B   D   8
27.34   B   D   9
11.54   B   E   10
0.86    B   E   10
0.68    B   E   11
4.00    B   E   11
It Figures
la source
2
Faraway's (2006) Extension du modèle linéaire avec R (p. 156): "La raison en est que REML estime les effets aléatoires en considérant les combinaisons linéaires des données qui suppriment les effets fixes. Si ces effets fixes sont modifiés, les probabilités de la deux modèles ne seront pas directement comparables. "
jvh_ch
Même si l'AIC est basé sur la vraisemblance, à ma connaissance, il a été développé à des fins de prédiction. Comment appliquer exactement un modèle mixte pour la prédiction?
AdamO
@AdamO, pourriez-vous être plus précis? Un modèle mixte ajusté peut être utilisé pour la prédiction, soit au niveau de la population (prédire les réponses pour une unité non spécifiée / inconnue en définissant les modes conditionnels / BLUPs à zéro) ou au niveau individuel (prédiction de la condition sur les estimations des modes conditionnels / BLUPs ). Si vous pouvez être plus précis, cela pourrait faire une bonne nouvelle question de CV.
Ben Bolker
Je ne savais tout simplement pas comment vous aviez l'intention d'appliquer ce modèle. Rien dans le problème ne suggérait quel type de prévision, le cas échéant, était en cours ou si elle était nécessaire et, le cas échéant, dans quel but.
AdamO

Réponses:

22

Zuur et al., Et Faraway (du commentaire de @ janhove ci-dessus) ont raison; L'utilisation de méthodes basées sur la vraisemblance (y compris l'AIC) pour comparer deux modèles avec des effets fixes différents qui sont ajustés par REML conduira généralement à un non-sens.

Ben Bolker
la source
4
Merci @janhove, AdamO et Ben Bolker. J'ai également trouvé ce lien d'Aaron utile pour répondre à cette question. Il dit: "La probabilité REML dépend des effets fixes qui sont dans le modèle, et ne sont donc pas comparables si les effets fixes changent. REML est généralement considéré comme donnant de meilleures estimations pour les effets aléatoires, cependant, donc le conseil habituel est d'adapter votre meilleur modèle utilisant REML pour votre inférence finale et vos rapports. "
It Figures
11

XX~RnX~XB

X~=XB

BXB

V

|V|1/2|X~V1X~|1/2exp((yX~β~)V1(yX~β~)/2)

β=(X~V1X~)1yX=X~B

|B||V|1/2||XV1X|1/2|exp((yXβ¯)V1(yXβ¯)/2)

β¯=(XV1X)1y|B|

|B|1

C'est un exemple de pourquoi REML ne devrait pas être utilisé lors de la comparaison de modèles avec différents effets fixes. REML, cependant, estime souvent mieux les paramètres des effets aléatoires et il est donc parfois recommandé d'utiliser ML pour les comparaisons et REML pour estimer un modèle unique (peut-être final).

swmo
la source