Spécification des effets aléatoires dans le modèle à effets mixtes lmer

8

Quelle est la difference entre (1|DNA.concentration/mouse.id)et (DNA.concentration|mouse.id)? Que signifient les symboles |et la /signification dans la syntaxe de l'effet aléatoire?

Yating Li
la source
qu'est-ce que le symbole "|" et "/" signifie en facteur aléatoire?
Yating Li
@gung La question n'est pas conforme aux règles du site. L'OP devrait contenir des informations sur ce qu'ils essaient de faire. Cependant, je pense qu'ils demandent la différence de syntaxe entre "/" et "|". Peut-être que le titre du message devrait refléter cela. Serait-ce une question valable?
Antoni Parellada
1
Votre réponse peut être ici
Antoni Parellada
3
Je ne pense pas que la question liée soit un duplicata approprié ... elle parle (1|a/b), mais pas de la distinction entre (1|a/b)et (b|a)...
Ben Bolker

Réponses:

14

Si vous avez deux facteurs catégorielsf et g, puis (1|f/g)s'étend à (1|f) + (1|f:g), c'est- à -dire la variation de l' ordonnée à l'origine (c'est le 1côté gauche de la barre) entre les niveaux de fet parmi les niveaux de f:g(l'interaction entre fet g). Ceci est également appelé un effet aléatoire de g niché dans f (l'ordre importe ici). C'est la manière traditionnelle de combiner deux facteurs aléatoires dans un modèle ANOVA classique, car dans ce cadre, les effets aléatoires doivent être imbriqués (c'est-à-dire soit fimbriqués dans, gsoit gimbriqués avec f). (Voir http://glmm.wikidot.com/faq pour plus d'informations sur les facteurs imbriqués.) Ce modèle estime deux paramètres, à savoir σf2 et σf:g2, quel que soit le nombre de niveaux de chaque variable catégorielle. Ce serait un modèle typique pour une conception imbriquée .

En revanche, (f|g)spécifie que les effets de fvarient selon les niveaux de g: par exemple, s'il fs'agit d'une variable catégorielle à deux niveaux avec les niveaux "contrôle" et "traitement", ce modèle spécifie que nous autorisons à la fois l'interception (réponse de contrôle) et l'effet du traitement (différence entre le contrôle et les réponses au traitement) pour varier selon les niveaux de g. Chaque effet a sa propre variance et lme4ajuste par défaut des covariances entre chacun des paramètres. Ce modèle estimerait les paramètresσg,c2, σg,t2, et σg,ct, où le dernier fait référence à la covariance entre les effets de contrôle et de traitement. Sif a n niveaux, ce modèle estime n(n+1)/2paramètres; il est plus approprié pour une conception de blocs randomisés où chaque traitement est répété dans chaque bloc.

Si elle fa plusieurs niveaux, cette dernière (f|g)spécification de modèle peut impliquer des modèles avec de nombreux paramètres; un débat est en cours (voir par exemple ce document ArXiv ) sur la meilleure façon de gérer cette situation.

Si à la place nous considérons (x|g)xest une variable d'entrée continue (numérique), alors le terme spécifie un modèle à pentes aléatoires; l'ordonnée à l'origine (implicitement) et la pente par rapport aux xdeux varient selon les niveaux de g(un terme de covariance est également ajusté).

Dans ce cas, cela (g|x)n'aurait aucun sens - le terme sur le côté droit de la barre est une variable de regroupement et est toujours interprété comme catégorique. Le seul cas où cela pourrait avoir un sens est dans une conception où xétait continu, mais plusieurs observations ont été prises à chaque niveau, et où vous vouliez traiter xcomme une variable catégorielle à des fins de modélisation.

Ben Bolker
la source