La question du CV
J'essaie de donner (a) une représentation mathématique détaillée et concise d'un modèle à effets mixtes. J'utilise le lme4
package dans R. Quelle est la représentation mathématique correcte pour mon modèle?
Les données, la question scientifique et le code R
Mon ensemble de données comprend des espèces dans différentes régions. Je teste si la prévalence d'une espèce change dans le temps menant à une extinction (les extinctions ne sont pas nécessairement permanentes; elle peut recoloniser), ou après une colonisation.
lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))
- La prévalence est la proportion de strates occupées par une espèce dans une région-année
- Le temps est une variable continue qui indique le temps d'extinction ou de colonisation; c'est toujours positif
- Le type est une variable catégorielle à deux niveaux. Ces deux niveaux sont «-» et «+». Lorsque le type est -, c'est une colonisation (niveau par défaut). Lorsque le type est +, c'est une extinction.
- Reg est une variable catégorielle à neuf niveaux, indiquant la région
- Spp est une variable catégorielle; le nombre de niveaux varie selon les régions et varie entre 48 niveaux et 144 niveaux.
En mots: la variable de réponse est la prévalence (proportion de strates occupées). Les effets fixes comprenaient 1) et l'interception, 2) le temps écoulé depuis l'événement et 3) l'interaction entre le temps passé et le type d'événement (colonisation ou extinction). Chacun de ces 3 effets fixes a varié de façon aléatoire entre les régions. Au sein d'une région, chacun des effets variait de manière aléatoire entre les espèces.
J'essaie de comprendre comment écrire l'équation mathématique pour le modèle. Je pense que je comprends ce qui se passe dans le code R (bien que, je suis sûr que j'ai des lacunes dans les connaissances, et j'espère que l'écriture de l'expression mathématique formelle améliorera ma compréhension).
J'ai beaucoup cherché sur le Web et sur ces forums. J'ai trouvé des tonnes d'informations utiles, bien sûr (et je vais peut-être créer un lien vers certaines d'entre elles dans une modification de cette question). Cependant, je ne pouvais pas vraiment trouver que "Rosetta Stone" du code R traduit en mathématiques (je suis plus à l'aise avec le code) qui m'aiderait vraiment à confirmer que ces équations sont correctes. En fait, je sais qu'il y a déjà des lacunes, mais nous y reviendrons.
Ma tentative
La forme de base d'un modèle à effets mixtes, en notation matricielle est (à ma connaissance):
β
- est la matrice de conception des effets fixes, Δ t est le temps après la colonisation () et Δ t + est le temps après l'extinction ()
time
time:type
- est la matrice de conception pour les effets aléatoires (niveau 1?), I () est la fonction d'indicateur donnant 1 si l'échantillon appartient à la région désignée et 0 sinon, r est indexé pour indiquer l'une des neuf régions.
- et γ contiennent des paramètres
- est une erreur; Je ne sais pas trop comment expliquer Σ , bien que je réalise qu'une de ces matrices de variance / covariance exprimera les covariances entre les pentes et les intersections, par exemple
En supposant que les choses jusqu'à présent sont ~ correctes, cela signifie que je suis bon au niveau supérieur. Cependant, expliquer la variation spécifique à l'espèce des paramètres, qui est imbriquée dans chaque région, m'a encore plus embrouillé.
Mais j'ai essayé quelque chose qui avait peut-être du sens ...
Edit: autres questions / réponses qui ont été quelque peu utiles
Réponses:
Si j'ai bien compris le code, pourquoi ne pas simplement écrire quelque chose comme
la source