Douglas Bates déclare que les modèles suivants sont équivalents «si la matrice de variance-covariance pour les effets aléatoires à valeur vectorielle a une forme spéciale, appelée symétrie composée» ( diapositive 91 dans cette présentation ):
m1 <- lmer(y ~ factor + (0 + factor|group), data)
m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data)
Plus précisément, Bates utilise cet exemple:
library(lme4)
data("Machines", package = "MEMSS")
m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines)
m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines)
avec les sorties correspondantes:
print(m1a, corr = FALSE)
Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (0 + Machine | Worker)
Data: Machines
REML criterion at convergence: 208.3112
Random effects:
Groups Name Std.Dev. Corr
Worker MachineA 4.0793
MachineB 8.6253 0.80
MachineC 4.3895 0.62 0.77
Residual 0.9616
Number of obs: 54, groups: Worker, 6
Fixed Effects:
(Intercept) MachineB MachineC
52.356 7.967 13.917
print(m2a, corr = FALSE)
Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (1 | Worker) + (1 | Worker:Machine)
Data: Machines
REML criterion at convergence: 215.6876
Random effects:
Groups Name Std.Dev.
Worker:Machine (Intercept) 3.7295
Worker (Intercept) 4.7811
Residual 0.9616
Number of obs: 54, groups: Worker:Machine, 18; Worker, 6
Fixed Effects:
(Intercept) MachineB MachineC
52.356 7.967 13.917
Quelqu'un peut-il expliquer la différence entre les modèles et comment se m1
réduit à m2
(étant donné la symétrie composée) de manière intuitive?
r
anova
mixed-model
repeated-measures
lme4-nlme
statmerkur
la source
la source
lme4
syntaxe. Il serait utile - et d'élargir le bassin de répondeurs potentiels - si vous les expliquiez à des personnes peu familièreslme4
.Réponses:
Dans cet exemple, il y a trois observations pour chaque combinaison des trois machines (A, B, C) et des six travailleurs. Je vais utiliser pour désigner une matrice d'identité à n dimensions et 1 n pour désigner un vecteur à n dimensions. Disons que y est le vecteur des observations, que je supposerai ordonné par travailleur puis machine puis répliqué. Soit μ les valeurs attendues correspondantes (par exemple les effets fixes), et soit γ un vecteur d'écarts spécifiques au groupe par rapport aux valeurs attendues (par exemple les effets aléatoires). Conditionnellement à γ , le modèle de y peut s'écrire:In n 1n n y μ γ γ y
où est la variance "résiduelle".σ2y
Pour comprendre comment la structure de covariance des effets aléatoires induit une structure de covariance parmi les observations, il est plus intuitif de travailler avec la représentation «marginale» équivalente , qui s'intègre aux effets aléatoires . La forme marginale de ce modèle est,γ
Ici, est une matrice de covariance qui dépend de la structure de γ (par exemple les "composantes de variance" sous-jacentes aux effets aléatoires). J'appellerai Σ la covariance "marginale".Σ γ Σ
Dans votre
m1
, les effets aléatoires se décomposent comme:Où est une matrice de conception qui mappe les coefficients aléatoires sur les observations, et θ T = [ θ 1 , A , θ 1 , B , θ 1 , C … θ 6 , A , θ 6 , B , θ 6 , C ] est le vecteur à 18 dimensions de coefficients aléatoires ordonné par le travailleur puis la machine, et est distribué comme:Z=I18⊗13 θT=[θ1,A,θ1,B,θ1,C…θ6,A,θ6,B,θ6,C]
Ici est la covariance des coefficients aléatoires. L'hypothèse de symétrie composée signifie que Λ a deux paramètres, que j'appellerai σ θ et τ , et la structure:Λ Λ σθ τ
(En d'autres termes, la matrice de corrélation sous-jacente à a tous les éléments de l'offdiagonal réglés sur la même valeur.)Λ
La structure de covariance marginale induite par ces effets aléatoires est , de sorte que la variance d'une observation donnée est σ 2 θ + τ 2 + σ 2 y et la covariance entre deux observations (distinctes) des travailleurs i , j et des machines u , v est: c o v ( y i , u , y j , v ) =Σ=Z(I6⊗Λ)ZT σ2θ+τ2+σ2y i,j u,v
Pour vous
m2
, les effets aléatoires se décomposent en:m2
m1
La brièveté n'est pas mon point fort: tout cela n'est qu'une façon longue et compliquée de dire que chaque modèle a deux paramètres de variance pour les effets aléatoires, et ne sont que deux façons différentes d'écrire le même modèle "marginal".
Dans du code ...
la source