Matrice de variance-covariance dans lmer

Je sais que l'un des avantages des modèles mixtes est qu'ils permettent de spécifier une matrice variance-covariance pour les données (symétrie composée, autorégressive, non structurée, etc.) Cependant, la lmerfonction en R ne permet pas de spécifier facilement cette matrice. Est-ce que quelqu'un sait quelle structure lmerutilise par défaut et pourquoi il n'y a aucun moyen de la spécifier facilement?

r mixed-model lme4-nlme covariance-matrix Nikita Kuznetsov
la source

Réponses:

Les modèles mixtes sont (des versions généralisées) des modèles de composants de variance. Vous notez la partie des effets fixes, ajoutez des termes d'erreur qui peuvent être courants pour certains groupes d'observations, ajoutez une fonction de liaison si nécessaire et mettez-la dans un maximiseur de vraisemblance.

Cependant, les diverses structures de variance que vous décrivez sont les modèles de corrélation de travail pour les équations d'estimation généralisées, qui compromettent une partie de la flexibilité des modèles mixtes / multiniveaux pour la robustesse de l'inférence. Avec les GEE, vous êtes uniquement intéressé à effectuer des inférences sur la partie fixe, et vous êtes d'accord pour ne pas estimer les composantes de la variance, comme vous le feriez dans un modèle mixte. Pour ces effets fixes, vous obtenez une estimation robuste / sandwich qui est appropriée même lorsque votre structure de corrélation est erronée. Cependant, l'inférence pour le modèle mixte s'effondrera si le modèle est mal spécifié.

Ainsi, tout en ayant beaucoup en commun (une structure à plusieurs niveaux et la capacité de traiter les corrélations résiduelles), les modèles mixtes et les GEE sont encore des procédures quelque peu distinctes. Le package R qui traite des GEE est correctement appelé gee, et dans la liste des valeurs possibles des corstroptions, vous trouverez les structures que vous avez mentionnées.

Du point de vue des GEE, lmerfonctionne avec des corrélations échangeables ... au moins lorsque le modèle a deux niveaux de hiérarchie, et que seules les intersections aléatoires sont spécifiées.

StasK
la source

Merci, Stas. Je n'ai jamais entendu parler des GEE auparavant et j'essaie juste d'apprendre la modélisation mixte (ce qui est délicat et est également amplifié par les différences d'implémentation logicielle). Je vais essayer GEE. J'ai vraiment une expérience simple avec des mesures répétées avec des mesures biomédicales dépendantes. Je m'intéresse principalement à la partie fixe. Ma formation précédente porte principalement sur les ANOVA à effets fixes standard, donc cela peut être une transition plus facile.

Nikita Kuznetsov

J'aime l'idée d'estimer les paramètres fixes et j'ai essayé la bibliothèque gee. Il existe également d'autres bibliothèques (geepack, par exemple). Sont-ils pires pour une raison quelconque? Dans mon domaine, les gens doivent déclarer des valeurs p. Existe-t-il un moyen de les obtenir à partir des estimations et d'effectuer également des comparaisons par paires en tenant compte du regroupement?

Nikita Kuznetsov

Des comparaisons par paires de quoi? La variété des bibliothèques R m'a toujours rendu fou, et je ne cherche pas les différences entre les packages à moins d'avoir vraiment besoin de travailler sur un modèle spécifique.

StasK

StatsK, est-ce vraiment correct? Je suis un débutant en modélisation multiniveaux mais Hox (2010) ou Rabe-Hesketh & Skrondal (2013) distinguent clairement entre différents estimateurs de variance via MLE et GEE. Par exemple, lors du calcul de l'erreur-type sandwich «robuste», Hox (p. 260) dit que vous pouvez soit les calculer via une modélisation à plusieurs niveaux en utilisant la matrice d'informations / l'inverse de la matrice de Hesse (en tenant compte de la structure à plusieurs niveaux) ou en estimant la variance de résidus bruts et utilisation de GLS par la suite pour calculer les coefficients (approche GEE)

Arne Jonas Warnke

Je ne suis pas sûr que la distinction suggérée par StasK soit vraiment correcte ici. Bien que ces structures de corrélation alternatives soient en effet utilisées par les GEE, il est parfaitement possible d'adapter des modèles mixtes (entièrement paramétriques) avec des structures plus compliquées pour la covariance d'effets aléatoires ou d'erreurs résiduelles, et le package nlme dans R, SAS Proc Mixed, ou Les commandes mixtes de Stata le font.

Jonathan Bartlett

La branche FlexLamba de lmer fournit une telle fonctionnalité.

Voir https://github.com/lme4/lme4/issues/224 pour des exemples de mise en œuvre d'une structure spécifique d'erreurs ou d'effets aléatoires.

majom
la source

Puis-je faire installer les branches régulière et FlexLambda à la fois?. Comment?

skan

À ma connaissance, lmer n'a pas de solution «simple» pour résoudre ce problème. Étant donné également que, dans la plupart des cas, lmer fait un usage intensif de matrices clairsemées pour la factorisation de Cholesky, il serait peu probable qu'il permette des VCV totalement non structurés.

$(1|RandEff_1)+(1|RandEff_2)$

$R = \begin{bmatrix} \sigma_{RE1}^2 & 0& 0 & & 0 & 0 & 0\\ 0 & \sigma_{RE1}^2& 0 & & 0 & 0 & 0\\ 0 & 0& \sigma_{RE1}^2 & & 0 & 0 & 0\\ 0& 0& 0 & & \sigma_{RE2}^2 & 0 & 0 \\ 0 & 0& 0 & & 0 & \sigma_{RE2}^2 & 0\\ 0& 0& 0 & & 0& 0 & \sigma_{RE2}^2 \\\end{bmatrix}$

Cependant, tout n'est pas perdu avec les LME: vous pouvez spécifier ces attributs de matrice VCV "facilement" si vous utilisez le package R MCMCglmm. Regardez le CourseNotes.pdf , p.70. Dans cette page, il donne quelques analogues sur la façon dont la structure des effets aléatoires lme4 serait définie, mais comme vous le verrez vous-même, lmer est moins flexible que MCMCglmm dans ce domaine.

A mi-chemin, il y a les classes lme corStruct de nlme, par exemple. corCompSymm , corAR1 , etc. etc. La réponse de Fabian dans cette bande de roulement donne quelques exemples plus concis pour la spécification VCM basée sur lme4 mais comme mentionné précédemment, ils ne sont pas aussi explicites que ceux de MCMCglmm ou nlme.

usεr11852 dit Reinstate Monic
la source

Je ne fais pas "confiance" à MCMCglmm, à cause du choix naïf des distributions antérieures.

Stéphane Laurent

R. Je ne pense pas que ce soit «naïf»; ils peuvent refléter des hypothèses valables. Vous pouvez même définir des antécédents inappropriés si vous ressentez cela fortement pour quelque chose. B. Ce n'était qu'une partie de ma réponse, cela ne disait pas que c'était la seule voie à suivre; J'ai donné un exemple pour lme4. C. Si vous avez besoin de faire des effets mixtes multivariés, c'est pratiquement le seul paquet disponible avec sabreR ...

usεr11852 dit Reinstate Monic

Désolé, mon commentaire n'était pas une critique de votre réponse. Quand j'ai dit "prieurs naïfs", j'ai parlé des prieurs non informatifs.

Stéphane Laurent

Il ne semble pas probable que cette matrice R soit correcte. Même l'ANOVA à mesures répétées "classique" permet des corrélations non nulles entre les conditions (je pense à la matrice de symétrie composée). Il me semble que cette matrice ne serait valable que pour une conception inter-sujets avec assignation aléatoire avec deux grappes.

Nikita Kuznetsov

(1 | R a n d E f f_{1}) + (1 | R a n d E f f_{2})

$(1|RandEff_1)+(1|RandEff_2)$