Quelle est la différence entre les équations d'estimation généralisées et le GLMM?

J'exécute un GEE sur des données asymétriques à 3 niveaux, en utilisant un lien logit. En quoi cela diffère-t-il (en termes de conclusions et de signification des coefficients) d'un GLM à effets mixtes (GLMM) et d'un lien logit?

Plus de détails: Les observations sont des essais bernoulli uniques. Ils sont regroupés en classes et écoles. Utilisation de R. Casewise omission des NA. 6 prédicteurs ont également des termes d'interaction.

(Je ne retourne pas les enfants pour voir s'ils atterrissent tête haute.)

Je suis enclin à exposer les coefficients aux odds-ratios. Est-ce que cela a le même sens dans les deux?

Il y a quelque chose qui se cache dans mon esprit à propos des «moyens marginaux» dans les modèles GEE. J'ai besoin qu'on m'explique ça.

Merci.

logistic mixed-model generalized-linear-model interpretation gee Rosser
la source

Les questions de CV suivantes traitent également de ce matériel: Différence entre les modèles linéaires généralisés et les modèles mixtes linéaires généralisés dans SPSS ; Quand utiliser les équations d'estimation généralisées par rapport aux modèles à effets mixtes? .

gung - Rétablir Monica

En termes d'interprétation des coefficients, il y a une différence dans le cas binaire (entre autres). Ce qui diffère entre GEE et GLMM est la cible de l'inférence: moyenne de la population ou spécifique au sujet .

Prenons un exemple inventé simple lié au vôtre. Vous voulez modéliser le taux d'échec entre les garçons et les filles dans une école. Comme dans la plupart des écoles (élémentaires), la population des élèves est divisée en salles de classe. Vous observez une réponse binaire de enfants en classes (ie réponses binaires groupées par classe), où si l' étudiant de classe passé et s'il /elle a échoué. Et $Y$ $n_i$ $N$ $\sum_{i=1}^{N}n_{i}$ $Y_{ij}=1$ $j$ $i$ $Y_{ij}=0$ si l'élèvede la classeest un homme et 0 sinon. $x_{ij} =1$ $j$ $i$

Pour reprendre la terminologie que j'ai utilisée dans le premier paragraphe, vous pouvez considérer l'école comme étant la population et les salles de classe comme étant les matières .

Considérons d'abord GLMM. GLMM ajuste un modèle à effets mixtes. Les conditions du modèle sur la matrice de conception fixe (qui dans ce cas se compose de l'ordonnée à l'origine et de l'indicateur de genre) et tout effet aléatoire parmi les salles de classe que nous incluons dans le modèle. Dans notre exemple, incluons une interception aléatoire, , qui prendra en compte les différences de base dans le taux d'échec entre les salles de classe. Nous modélisons donc $b_i$

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}, b_i\right)=\beta_0+\beta_1 x_{ij} + b_i$

Le rapport de cotes du risque d'échec dans le modèle ci-dessus diffère en fonction de la valeur de qui est différente entre les salles de classe. Ainsi, les estimations sont spécifiques au sujet . $b_i$

GEE, d'autre part, correspond à un modèle marginal. Ces moyennes de population du modèle . Vous modélisez l'attente conditionnelle uniquement à votre matrice de conception fixe.

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}\right)=\beta_0+\beta_1 x_{ij}$

Cela contraste avec les modèles à effets mixtes comme expliqué ci-dessus qui conditionnent à la fois la matrice de conception fixe et les effets aléatoires. Donc, avec le modèle marginal ci-dessus, vous dites: «oubliez la différence entre les salles de classe, je veux juste le taux d'échec de la population (au niveau de l'école) et son association avec le sexe». Vous ajustez le modèle et obtenez un rapport de cotes qui est le rapport de cotes moyen de la population de l'échec associé au sexe.

Ainsi, vous pouvez constater que vos estimations de votre modèle GEE peuvent différer vos estimations de votre modèle GLMM et c'est parce qu'ils n'évaluent pas la même chose.

(En ce qui concerne la conversion du log-odds-ratio en odds-ratio en exponentiant, oui, vous le faites que ce soit une estimation au niveau de la population ou du sujet)

Quelques notes / littérature:

Pour le cas linéaire, les estimations de la population moyenne et des sujets sont les mêmes.

Zeger et al. 1988 a montré que pour la régression logistique,

$\beta_M\approx \left[ \left(\frac{16\sqrt{3}}{15\pi }\right)^2 V+1\right]^{-1/2}\beta_{RE}$

$\beta_M$ $\beta_{RE}$ $V$

Molenberghs, Verbeke 2005 contient un chapitre entier sur les modèles à effets marginaux et aléatoires.

J'ai pris connaissance de ce sujet et du matériel connexe dans un cours basé beaucoup sur Diggle, Heagerty, Liang, Zeger 2002 , une excellente référence.

la source

Mike: Est-il trop simple de dire qu'un GEE fait la moyenne des effets aléatoires?

B_Miner

@B_Miner Pas trop simple du tout, c'est exactement ce que vous faites :)

@Mike Wierzbicki: Réponse agréable et nette, Mike! Un petit détail que je pourrais ajouter dans votre "Quelques notes / littérature": GEE et GLMM sont les mêmes dans le cas linéaire (réponse gaussienne, lien d'identité) que lorsque vous spécifiez une matrice de corrélation échangeable pour le GEE.

N'existe-t-il pas également un GEE spécifique à un sujet?

giordano

@MikeWierzbicki Donc, si je vous comprends bien, un GEE n'est rien de plus qu'un simple modèle à effets mixtes sans effets aléatoires (ce qui en fait une simple ligne de régression non linéaire)?

Robin Kramer

Quelle est la différence entre les équations d'estimation généralisées et le GLMM?

Réponses: