Comprendre la variance des effets aléatoires dans les modèles lmer ()

J'ai du mal à comprendre la sortie de mon lmer()modèle. Il s'agit d'un modèle simple d'une variable de résultat (prise en charge) avec différentes interceptions d'état / effets aléatoires d'état:

mlm1 <- lmer(Support ~ (1 | State))

Les résultats de summary(mlm1)sont:

Linear mixed model fit by REML 
Formula: Support ~ (1 | State) 
   AIC   BIC logLik deviance REMLdev
 12088 12107  -6041    12076   12082
Random effects:
 Groups   Name        Variance  Std.Dev.
 State    (Intercept) 0.0063695 0.079809
 Residual             1.1114756 1.054265
Number of obs: 4097, groups: State, 48

Fixed effects:
            Estimate Std. Error t value
(Intercept)  0.13218    0.02159   6.123

Je suppose que la variance des interceptions d’états variables / effets aléatoires est 0.0063695 . Mais quand j'extrais le vecteur de ces effets aléatoires d'état et calcule la variance

var(ranef(mlm1)$State)

Le résultat est: 0.001800869 considérablement plus petit que la variance rapportée parsummary() .

Pour autant que je le comprenne, le modèle que j'ai spécifié peut s'écrire:

$y_i = \alpha_0 + \alpha_s + \epsilon_i, \text{ for } i = \{1, 2, ..., 4097\}$

$\alpha_s \sim N(0, \sigma^2_\alpha), \text{ for } s = \{1, 2, ..., 48\}$

$\alpha_s$ $\sigma^2_\alpha$ lmer()

r mixed-model random-effects-model lme4-nlme nomad545
la source

lmer()

σ_{α}^{2}

$\sigma^2_\alpha$

{\hat{α}}_{s}

$\hat\alpha_s$

y_{i}

$y_i$

y_{i s}

$y_{is}$

Voici une question très similaire, avec une réponse quelque peu différente

Arne Jonas Warnke

Réponses:

Ceci est un anova classique à sens unique. Une réponse très courte à votre question est que la composante variance est composée de deux termes.

{\hat{σ}}_{α}^{2} = E [\frac{1}{48} \sum_{s = 1}^{48} α_{s}^{2}] = \frac{1}{48} \sum_{s = 1}^{48} {\hat{α}}_{s}^{2} + \frac{1}{48} \sum_{s = 1}^{48} v une r ({\hat{α}}_{s})

$\hat{\sigma}^2_{\alpha}=E\left[\frac{1}{48}\sum_{s=1}^{48} \alpha_s^2\right]= \frac{1}{48}\sum_{s=1}^{48}\hat{ \alpha }_s^2 +\frac{1}{48}\sum_{s=1}^{48}var(\hat{ \alpha }_s)$

Ainsi, le terme que vous avez calculé est le premier terme sur la droite (car les effets aléatoires ont un zéro moyen). Le deuxième terme dépend de l'utilisation de REML de ML et de la somme des erreurs standard au carré de vos effets aléatoires.

probabilitéislogique
la source

OK, j'ai compris! Ainsi, la somme des SE au carré des RE - 1/48 * sum((se.ranef(mlm1)$State)^2)- est 0.004557198. La variance des estimations ponctuelles des ER (obtenues, comme ci-dessus, en utilisant var(ranef(mlm1)$State)) est 0.001800869. La somme est 0.006358067, qui est la variance rapportée à l'aide summary()du lmer()modèle ci-dessus, à 4 ou 5 chiffres au moins. Merci beaucoup @probability

nomad545

Pour ceux qui recherchent cette réponse et le commentaire pour obtenir de l'aide, notez que nomad545 a également utilisé le armpackage R pour la se.ranef()fonction.

ndoogan

@probabilityislogic: Can you provide some more detail how that equation was calculated? Specifically, how was the second equality achieved? Also, shoudn't there be a hat on the alpha after the first equality?

user1357015

@user1357015 - one way to see this is to look at the gradient of the (marginal) log likelihood after integrating out the random effects. That is, differentiate the likelihood

Y \sim N o r m a l (1_{n} α_{0}, Σ)

$Y\sim Normal (1_n\alpha_0,\Sigma)$ where

Σ = I_{n} σ_{e}^{2} + σ_{α}^{2} Z Z^{T}

$\Sigma=I_n\sigma^2_e+\sigma^2_{\alpha} ZZ^T$ is the "unconditional" variance of Y. If you do this (plus using some manipulations) you get the above equality. The second equality follows because

E (α_{s}) = 0

$E (\alpha_s)=0$ (under the model) meaning

v a r (α_{s}) = E (α_{s}^{2})

$var (\alpha_s)=E (\alpha_s^2)$

probabilityislogic