Comment interpréter la variance de l'effet aléatoire dans un modèle mixte linéaire généralisé

9

Dans un modèle mixte linéaire généralisé logistique (famille = binôme), je ne sais pas comment interpréter la variance à effets aléatoires:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Comment interpréter ce résultat numérique?

J'ai un échantillon de patients transplantés rénaux dans une étude multicentrique. Je testais si la probabilité qu'un patient soit traité avec un traitement antihypertenseur spécifique soit la même parmi les centres. La proportion de patients traités varie considérablement d'un centre à l'autre, mais peut être due à des différences dans les caractéristiques basales des patients. J'ai donc estimé un modèle mixte linéaire généralisé (logistique), ajustant les principales caractéristiques des patiens. Voici les résultats:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Les variables quantitatives sont centrées. Je sais que l'écart-type entre les hôpitaux de l'ordonnée à l'origine est de 0,65554, sur une échelle de log-odds. Parce que l'ordonnée à l'origine est de -1,804469, sur une échelle de log-odds, la probabilité d'être traité avec l'antihypertenseur d'un homme, d'âge moyen, avec une valeur moyenne dans toutes les variables et le traitement inmuno A, pour un centre "moyen", est de 14,1% . Et maintenant commence l'interprétation: sous l'hypothèse que les effets aléatoires suivent une distribution normale, nous nous attendrions à ce qu'environ 95% des centres aient une valeur à moins de 2 écarts-types de la moyenne de zéro, donc la probabilité d'être traité pour l'homme moyen variera entre les centres avec un intervalle de couverture de:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Est-ce correct?

De plus, comment puis-je tester dans glmer si la variabilité entre les centres est statistiquement significative? J'avais l'habitude de travailler avec MIXNO, un excellent logiciel de Donald Hedeker, et là j'ai une erreur standard de la variance estimée, que je n'ai pas dans glmer. Comment puis-je avoir la probabilité d'être traité pour l'homme "moyen" dans chaque centre, avec un intervalle de confiance?

Merci

user2310909
la source

Réponses:

10

C'est probablement très utile si vous nous montrez plus d'informations sur votre modèle, mais: la valeur de référence des log-odds de quelle que soit votre réponse (par exemple la mortalité) varie d'un hôpital à l'autre. La valeur de référence (le terme d'interception par hôpital) est le log-odds de mortalité (ou autre) dans la catégorie de référence (par exemple "non traité"), à une valeur nulle de tout prédicteur continu. Cette variation est supposée être normalement distribuée, sur l'échelle log-odds. L'écart type entre les hôpitaux de l'interception est de 0,65554; la variance (juste l'écart-type au carré - pas une mesure de l'incertitude de l'écart-type) est de .0.65542=0.4295

(Si vous clarifiez votre question / ajoutez plus de détails sur votre modèle, je peux essayer d'en dire plus.)

mise à jour : votre interprétation de la variation semble correcte. Plus précisément,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

devrait vous donner l'intervalle de 95% (pas vraiment des intervalles de confiance, mais très similaire) pour les probabilités qu'une personne de référence (homme / âge moyen / etc.) soit traitée dans tous les hôpitaux.

Pour tester la signification de l'effet aléatoire, vous avez une variété de choix (voir http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html pour plus d'informations). (Notez que l'erreur standard d'une variance RE n'est généralement pas un moyen fiable de tester la signification, car la distribution d'échantillonnage est souvent asymétrique / non normale.) L'approche la plus simple consiste à effectuer un test de rapport de vraisemblance, par exemple

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

La division finale par 2 corrige le fait que le test du rapport de vraisemblance est conservateur lorsque la valeur nulle (c.-à-d. Variance RE = 0) est à la frontière de l'espace réalisable (c.-à-d. Que la variance RE ne peut pas être <0).

Ben Bolker
la source
J'ai édité la question
user2310909
1
Merci, c'est un plaisir de lire à quelqu'un qui connaît bien le sujet.
user2310909