Spécification des effets aléatoires dans le modèle à effets mixtes lmer
8
Quelle est la difference entre (1|DNA.concentration/mouse.id)et (DNA.concentration|mouse.id)? Que signifient les symboles |et la /signification dans la syntaxe de l'effet aléatoire?
qu'est-ce que le symbole "|" et "/" signifie en facteur aléatoire?
Yating Li
@gung La question n'est pas conforme aux règles du site. L'OP devrait contenir des informations sur ce qu'ils essaient de faire. Cependant, je pense qu'ils demandent la différence de syntaxe entre "/" et "|". Peut-être que le titre du message devrait refléter cela. Serait-ce une question valable?
Je ne pense pas que la question liée soit un duplicata approprié ... elle parle (1|a/b), mais pas de la distinction entre (1|a/b)et (b|a)...
Ben Bolker
Réponses:
14
Si vous avez deux facteurs catégorielsf et g, puis (1|f/g)s'étend à (1|f) + (1|f:g), c'est- à -dire la variation de l' ordonnée à l'origine (c'est le 1côté gauche de la barre) entre les niveaux de fet parmi les niveaux de f:g(l'interaction entre fet g). Ceci est également appelé un effet aléatoire de gniché dansf (l'ordre importe ici). C'est la manière traditionnelle de combiner deux facteurs aléatoires dans un modèle ANOVA classique, car dans ce cadre, les effets aléatoires doivent être imbriqués (c'est-à-dire soit fimbriqués dans, gsoit gimbriqués avec f). (Voir http://glmm.wikidot.com/faq pour plus d'informations sur les facteurs imbriqués.) Ce modèle estime deux paramètres, à savoir σ2f et σ2f:g, quel que soit le nombre de niveaux de chaque variable catégorielle. Ce serait un modèle typique pour une conception imbriquée .
En revanche, (f|g)spécifie que les effets de fvarient selon les niveaux de g: par exemple, s'il fs'agit d'une variable catégorielle à deux niveaux avec les niveaux "contrôle" et "traitement", ce modèle spécifie que nous autorisons à la fois l'interception (réponse de contrôle) et l'effet du traitement (différence entre le contrôle et les réponses au traitement) pour varier selon les niveaux de g. Chaque effet a sa propre variance et lme4ajuste par défaut des covariances entre chacun des paramètres. Ce modèle estimerait les paramètresσ2g,c, σ2g,t, et σg,c⋅t, où le dernier fait référence à la covariance entre les effets de contrôle et de traitement. Sif a n niveaux, ce modèle estime n(n+1)/2paramètres; il est plus approprié pour une conception de blocs randomisés où chaque traitement est répété dans chaque bloc.
Si elle fa plusieurs niveaux, cette dernière (f|g)spécification de modèle peut impliquer des modèles avec de nombreux paramètres; un débat est en cours (voir par exemple ce document ArXiv ) sur la meilleure façon de gérer cette situation.
Si à la place nous considérons (x|g)où xest une variable d'entrée continue (numérique), alors le terme spécifie un modèle à pentes aléatoires; l'ordonnée à l'origine (implicitement) et la pente par rapport aux xdeux varient selon les niveaux de g(un terme de covariance est également ajusté).
Dans ce cas, cela (g|x)n'aurait aucun sens - le terme sur le côté droit de la barre est une variable de regroupement et est toujours interprété comme catégorique. Le seul cas où cela pourrait avoir un sens est dans une conception où xétait continu, mais plusieurs observations ont été prises à chaque niveau, et où vous vouliez traiter xcomme une variable catégorielle à des fins de modélisation.
(1|a/b)
, mais pas de la distinction entre(1|a/b)
et(b|a)
...Réponses:
Si vous avez deux facteurs catégorielsσ2f et σ2f:g , quel que soit le nombre de niveaux de chaque variable catégorielle. Ce serait un modèle typique pour une conception imbriquée .
f
etg
, puis(1|f/g)
s'étend à(1|f) + (1|f:g)
, c'est- à -dire la variation de l' ordonnée à l'origine (c'est le1
côté gauche de la barre) entre les niveaux def
et parmi les niveaux def:g
(l'interaction entref
etg
). Ceci est également appelé un effet aléatoire deg
niché dansf
(l'ordre importe ici). C'est la manière traditionnelle de combiner deux facteurs aléatoires dans un modèle ANOVA classique, car dans ce cadre, les effets aléatoires doivent être imbriqués (c'est-à-dire soitf
imbriqués dans,g
soitg
imbriqués avecf
). (Voir http://glmm.wikidot.com/faq pour plus d'informations sur les facteurs imbriqués.) Ce modèle estime deux paramètres, à savoirEn revanche,σ2g,c , σ2g,t , et σg,c⋅t , où le dernier fait référence à la covariance entre les effets de contrôle et de traitement. Sif a n niveaux, ce modèle estime n(n+1)/2 paramètres; il est plus approprié pour une conception de blocs randomisés où chaque traitement est répété dans chaque bloc.
(f|g)
spécifie que les effets def
varient selon les niveaux deg
: par exemple, s'ilf
s'agit d'une variable catégorielle à deux niveaux avec les niveaux "contrôle" et "traitement", ce modèle spécifie que nous autorisons à la fois l'interception (réponse de contrôle) et l'effet du traitement (différence entre le contrôle et les réponses au traitement) pour varier selon les niveaux deg
. Chaque effet a sa propre variance etlme4
ajuste par défaut des covariances entre chacun des paramètres. Ce modèle estimerait les paramètresSi elle
f
a plusieurs niveaux, cette dernière(f|g)
spécification de modèle peut impliquer des modèles avec de nombreux paramètres; un débat est en cours (voir par exemple ce document ArXiv ) sur la meilleure façon de gérer cette situation.Si à la place nous considérons
(x|g)
oùx
est une variable d'entrée continue (numérique), alors le terme spécifie un modèle à pentes aléatoires; l'ordonnée à l'origine (implicitement) et la pente par rapport auxx
deux varient selon les niveaux deg
(un terme de covariance est également ajusté).Dans ce cas, cela
(g|x)
n'aurait aucun sens - le terme sur le côté droit de la barre est une variable de regroupement et est toujours interprété comme catégorique. Le seul cas où cela pourrait avoir un sens est dans une conception oùx
était continu, mais plusieurs observations ont été prises à chaque niveau, et où vous vouliez traiterx
comme une variable catégorielle à des fins de modélisation.la source