Modèle marginal versus modèle à effets aléatoires - comment choisir entre eux? Un conseil pour un profane

11

En recherchant des informations sur le modèle marginal et le modèle à effets aléatoires , et comment choisir entre eux, j'ai trouvé quelques informations mais c'était une explication plus ou moins mathématique abstraite (comme par exemple ici: https: //stats.stackexchange .com / a / 68753/38080 ). Quelque part, j'ai constaté qu'il y avait des différences substantielles observées entre les estimations d'un paramètre entre ces deux méthodes / modèles ( http://www.biomedcentral.com/1471-2288/2/15/ ), mais l'inverse a été écrit par Zuur et al . (2009, p. 116; http://link.springer.com/book/10.1007%2F978-0-387-87458-6). Le modèle marginal (approche par équation d'estimation généralisée) apporte des paramètres moyens à la population, tandis que les résultats du modèle à effets aléatoires (modèle mixte linéaire généralisé) prennent en compte l'effet aléatoire - sujet (Verbeke et al. 2010, pp. 49-52; http: / /link.springer.com/chapter/10.1007/0-387-28980-1_16 ).

Je voudrais voir une explication semblable à un profane de ces modèles illustrée sur des exemples de modèles (réels) dans un langage familier aux non-statisticiens et non-mathématiciens.

En détail, je voudrais savoir:

Quand faut-il utiliser le modèle marginal et quand faut-il utiliser le modèle à effets aléatoires? Pour quelles questions scientifiques ces modèles conviennent-ils?

Comment interpréter les résultats de ces modèles?

benjamin jarcuska
la source

Réponses:

14

Merci d'avoir lié ma réponse! Je vais essayer de donner une explication explicite. Cette question a été discutée à plusieurs reprises sur ce site (voir les questions connexes sur le côté droit), mais elle est vraiment déroutante et importante pour un "profane".

Tout d'abord, pour les modèles linéaires (réponse continue), les estimations des modèles marginaux et conditionnels (effets aléatoires) coïncident. Je vais donc me concentrer sur les modèles non linéaires, en particulier la régression logistique pour les données binaires.

Questions scientifiques

L'exemple le plus utilisé pour distinguer les modèles marginaux et conditionnels est:

Si vous êtes médecin et que vous voulez une estimation de la quantité de médicament à base de statine qui réduira les chances de votre patient de faire une crise cardiaque, le coefficient spécifique au sujet est le choix évident. D'un autre côté, si vous êtes un responsable de la santé de l'État et que vous voulez savoir comment le nombre de personnes décédées de crises cardiaques changerait si tout le monde dans la population à risque prenait le médicament tachant, vous voudriez probablement utiliser la population –Coefficients moyens . (Allison, 2009)

Les deux types de questions scientifiques correspondent à ces deux modèles.

Illustration

La meilleure illustration que j'ai vue jusqu'à présent est la figure suivante dans Applied Longitudinal Analysis ( Fitzmaurice, Laird et Ware, 2011 , page 479), si nous changeons la covariable de «statine drug» en «time». Il est clair que les deux modèles diffèrent dans l'échelle des coefficients, ce qui peut s'expliquer essentiellement par le fait que la moyenne d'une fonction non linéaire d'une variable aléatoire n'est pas égale à la fonction non linéaire de la moyenne.

entrez la description de l'image ici

Interprétation

Dans la figure ci-dessus, les lignes pointillées proviennent d'un modèle d'interception aléatoire. Il montre que nous devons contrôler la constante des effets aléatoires lors de l'interprétation des effets fixes, c'est-à-dire ne suivre qu'une ligne lors de l'interprétation de la pente. C'est pourquoi nous appelons les estimations des modèles à effets aléatoires «spécifiques au sujet». Plus précisément,

  • Pour les modèles conditionnels, l'interprétation est la suivante: comment les cotes logarithmiques changeraient-elles avec un changement d'unité de temps pour un sujet donné? (Voir page 403 de Fitzmaurice, Laird et Ware (2011) au sujet de la discussion sur les raisons pour lesquelles l'interprétation des covariables invariantes dans le temps dans les modèles conditionnels est potentiellement trompeuse.)
  • Pour les modèles marginaux, l'interprétation est exactement la même que l'interprétation des régressions linéaires, c'est-à-dire comment les cotes logarithmiques changeraient avec un changement d'unité de temps, ou le rapport de cotes logarithmiques du médicament par rapport au placebo.

Il y a un autre exemple sur ce site.

Randel
la source
Merci beaucoup pour cette belle réponse! J'ai encore une question: vous avez écrit que les estimations des modèles à effets marginaux et aléatoires coïncident pour les modèles linéaires - cela vaut-il également pour les modèles à effets aléatoires avec des intersections et des pentes aléatoires, s'il y a des différences dans les pentes aléatoires?
benjamin jarcuska
2
Oui, les estimations des effets fixes dans le modèle à effets aléatoires et les estimations du modèle moyen dans les modèles marginaux coïncident, quelle que soit la structure des effets aléatoires.
Randel
Je me demandais simplement si quelqu'un aurait peut-être un exemple concret des deux approches de modélisation en R? Peut-être pour cet exemple spécifique, car il semble assez didactique?
Tom Wenseleers,