Interpréter trois formes d'un «modèle mixte»

19

Il y a une distinction qui me fait trébucher avec des modèles mixtes, et je me demande si je pourrais obtenir une certaine clarté. Supposons que vous ayez un modèle mixte de données de comptage. Il y a une variable que vous voulez comme effet fixe (A) et une autre variable pour le temps (T), regroupées par exemple une variable "Site".

Si je comprends bien:

glmer(counts ~ A + T, data=data, family="Poisson") est un modèle à effets fixes.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") est un modèle à effet aléatoire.

Ma question est quand vous avez quelque chose comme:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")ce est t? Est-ce un effet aléatoire? Un effet fixe? Que fait-on réellement en mettant T aux deux endroits?

Quand quelque chose ne devrait-il apparaître que dans la section des effets aléatoires de la formule du modèle?

Fomite
la source

Réponses:

22

Cela peut devenir plus clair en écrivant la formule du modèle pour chacun de ces trois modèles. Soit Yij l'observation de la personne i dans le site j de chaque modèle et définissons Aij,Tij manière analogue pour faire référence aux variables de votre modèle.

glmer(counts ~ A + T, data=data, family="Poisson") est le modèle

Journal(E(Ouijej))=β0+β1UNEjej+β2Tjej

qui est juste un modèle de régression de poisson ordinaire.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") est le modèle

Journal(E(Ouijej))=α0+ηj0+ηj1UNEjej+ηj2Tjej

sont des effets aléatoires partagés par chaque observation faite par des individus du site j . Ces effets aléatoires peuvent être librement corrélés (c'est-à-dire qu'aucune restriction n'est faite sur Σ ) dans le modèle que vous avez spécifié. Pour imposer l'indépendance, vous devez les placer entre des crochets différents, par exemple . Ce modèle suppose que log ( E ( Y i jηj=(ηj0,ηj1,ηj2)N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site) est α 0 pour tous les sites mais chaque site a un décalage aléatoire ( η j 0 ) et a une relation linéaire aléatoire avec les deux A i j , T i j .log(E(Yij))α0ηj0Aij,Tij

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") est le modèle

log(E(Yij))=(θ0+γj0)+θ1Aij+(θ2+γj1)Tij

Alors maintenant a une relation "moyenne" avec A i j , T i j , donnée par les effets fixes θ 0 , θ 1 , θ 2 mais cette relation est différente pour chaque site et ces différences sont capturés par les effets aléatoires, γ j 0 , γ j 1 , γ j 2log(E(Yij))Aij,Tijθ0,θ1,θ2γj0,γj1,γj2. Autrement dit, la ligne de base est décalée de manière aléatoire et les pentes des deux variables sont décalées de manière aléatoire et tout le monde du même site partage le même décalage aléatoire.

ce est t? Est-ce un effet aléatoire? Un effet fixe? Que fait-on réellement en mettant T aux deux endroits?

est l'une de vos covariables. Ce n'est pas un effet aléatoire -c'est un effet aléatoire. Il y a un effet fixe de T qui est différent selon l'effet aléatoire conféré par- γ j 1 dans le modèle ci-dessus. Ce qui est accompli en incluant cet effet aléatoire est de permettre l'hétérogénéité entre les sites dans la relation entre T et log ( E ( Y i j ) ) .TSiteTSiteγj1Tlog(E(Yij))

Quand quelque chose doit-il apparaître uniquement dans la section des effets aléatoires de la formule du modèle?

C'est une question de sens dans le contexte de l'application.

Concernant l'interception - vous devriez garder l'interception fixe là pour beaucoup de raisons (voir, par exemple, ici ); re: l'ordonnée à l'origine aléatoire, , ceci agit principalement pour induire une corrélation entre les observations faites sur le même site. S'il n'est pas logique qu'une telle corrélation existe, alors l'effet aléatoire doit être exclu.γj0

En ce qui concerne les pentes aléatoires, un modèle avec uniquement des pentes aléatoires et sans pentes fixes reflète une croyance selon laquelle, pour chaque site, il existe une relation entre le et vos covariables pour chaque site, mais si vous faites la moyenne de celles-ci effets sur tous les sites, alors il n'y a pas de relation. Par exemple, si vous aviez une pente aléatoire en T mais aucune pente fixe, cela reviendrait à dire que le temps, en moyenne, n'a aucun effet (par exemple, aucune tendance séculaire dans les données) mais que chacun se dirige dans une direction aléatoire dans le temps, ce qui pourrait avoir un sens. Encore une fois, cela dépend de l'application.log(E(Yij))TSite

Notez que vous pouvez ajuster le modèle avec et sans effets aléatoires pour voir si cela se produit - vous ne devriez voir aucun effet dans le modèle fixe mais des effets aléatoires significatifs dans le modèle suivant. Je dois vous avertir que les décisions comme celle-ci sont souvent mieux prises en fonction de la compréhension de l'application plutôt qu'en sélectionnant un modèle.

Macro
la source
2
(+1): écrire la formule du modèle pour chaque modèle est en effet le meilleur moyen de rendre les notations R plus transparentes; bon travail!
ocram
@Macro Une question sur les équations ci-dessus (merci pour eux btw) - ont-ils aussi le terme d'erreur habituel? Si oui, quel est l'indice de ce terme?
Fomite
2
E(Ouijej|X)Ouijej|X
Macro
11

Vous devez noter que ce Tn'est pas un terme d'effets aléatoires de votre modèle, mais un effet fixe. Les effets aléatoires ne sont que les effets qui apparaissent après le |dans une lmerformule!

Une discussion plus approfondie de ce que fait cette spécification peut être trouvée dans cette question de la FAQ lmer .

À partir de ces questions, votre modèle devrait donner les éléments suivants (pour votre effet fixe T):

  • Une pente globale
  • Un terme de pentes aléatoires spécifiant l'écart par rapport à la pente globale pour chaque niveau de Site
  • La corrélation entre les pentes aléatoires.

Et comme l'a dit @ mark999, il s'agit bien d'une spécification courante. Dans les conceptions de mesures répétées, vous souhaitez généralement avoir des pentes et des corrélations aléatoires pour tous les facteurs de mesures répétées (intra-sujets).

Voir le papier suivant pour quelques exemples (que j'ai tendance à citer toujours ici):

Judd, CM, Westfall, J., et Kenny, DA (2012). Traiter les stimuli comme un facteur aléatoire en psychologie sociale: une solution nouvelle et complète à un problème omniprésent mais largement ignoré. Journal of Personality and Social Psychology , 103 (1), 54–69. doi: 10.1037 / a0028347

Henrik
la source
2
Une référence similaire de l'écologie: Schielzeth, Holger et Wolfgang Forstmeier. 2009. «Conclusions au-delà du soutien: estimations trop sûres dans les modèles mixtes». Écologie comportementale 20 (2) (1er mars): 416-420. doi: 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Ben Bolker
1

Quelque chose ne devrait apparaître que dans la partie aléatoire lorsque vous n'êtes pas particulièrement intéressé par son paramètre, en soi, mais devez l'inclure pour éviter les données dépendantes. Par exemple, si les enfants sont imbriqués dans des classes, vous ne souhaitez généralement les enfants que comme un effet aléatoire.

Peter Flom - Réintégrer Monica
la source
1
Je vous comprends peut-être mal, mais j'aurais pensé qu'avoir des effets fixes et aléatoires pour la même variable était plus courant qu'une variable ayant juste un effet aléatoire. Avoir des effets fixes et aléatoires pour la même variable n'est pas rare dans le livre de Pinheiro et Bates.
mark999
2
@MichaelChernick si je comprends bien, si vous avez un effet fixe et un effet aléatoire pour la même variable, alors l'effet fixe est l'effet global dans la population, tandis que l'effet aléatoire permet un effet différent de la variable pour chaque sujet. Il existe plusieurs exemples dans Pinheiro & Bates.
mark999
2
@PeterFlom, re: "si des enfants sont imbriqués dans des classes, vous ne voulez généralement des enfants que comme un effet aléatoire." Je pense que vous voulez dire que la classe est l'effet aléatoire. À moins qu'il n'y ait plus de nidification dans les données (par exemple des mesures répétées sur les enfants), les effets aléatoires au niveau de l'enfant ne sont pas identifiés.
Macro du
1
@macro Oui, c'est ce que je voulais dire, désolé. La terminologie devient très confuse! C'est peut-être la raison pour laquelle Gelman évite les termes «fixe» et «aléatoire»
Peter Flom - Rétablir Monica
2
@Michael, je suis d'accord avec toi. Dans ces types de modèles hiérarchiques, les effets aléatoires sont définis par une variable de regroupement (contrairement à d'autres modèles multivariés tels que les ensembles de données indexées spatialement, où la variable de «regroupement» varie continuellement). Dans la question du PO, Siteserait appelé l'effet aléatoire, pas Tou Aou autre chose. En pensant à cela de cette façon, Sitel'effet de clairement ne pouvait pas être à la fois fixe et aléatoire, car les deux ne seraient pas identifiés l'un à l'autre. Vous pouvez avoir des coefficients fixes et aléatoires pour une variable, mais c'est une question différente.
Macro du