Conception de modèle à effets mixtes avec une variable d'échantillonnage

11

J'essaie de spécifier une formule pour un modèle linéaire à effets mixtes (avec lme4) pour ma conception expérimentale, mais je ne suis pas sûr de bien faire les choses.

La conception: en gros, je mesure un paramètre de réponse sur les plantes. J'ai 4 niveaux de traitement et 2 niveaux d'irrigation. Les plantes sont regroupées en 16 parcelles, au sein de chaque parcelle j'échantillon 4 sous-parcelles. Dans chaque sous-parcelle, je prends entre 15 et 30 observations (selon le nombre de plantes trouvées). Autrement dit, il y a un total de 1500 lignes.

entrez la description de l'image ici

Initialement, le niveau de la sous-parcelle était juste ici à des fins d'échantillonnage, mais j'ai pensé que j'aimerais en tenir compte dans le modèle (en tant que variable à 64 niveaux) parce que j'ai vu qu'il y avait beaucoup de variabilité d'une sous-parcelle à l'autre , même à l'intérieur d'une même parcelle (supérieure à la variabilité entre des parcelles entières).

Ma première idée a été d'écrire:

library(lme4)
fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata)

ou

fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata)

Est-ce exact? Je ne sais pas si je dois conserver les deux niveaux de tracé / sous-tracé dans ma formule. Aucun effet fixe n'est significatif mais les effets aléatoires sont très significatifs.

agenis
la source

Réponses:

9

Votre modèle doit être écrit comme

fit <- lmer(y ~ treatment*irrigation + (1|plot/subplot), data=mydata)

car les sous-tracés sont imbriqués dans le site. bien que (1|plot)+ (1|subplot)fonctionnerait si les sous-tracés sont étiquetés de manière unique (c'est-à-dire 1A, 1B, 1C, ..., 2A, 2B, 2C plutôt que A, B, C ..., A, B, C). Mon chapitre de livre de Fox et al. Les statistiques écologiques décrivent un exemple de nidification:

D'un autre côté, dans l'exemple de la tique, chaque poussin se produit dans une seule couvée et chaque couvée se trouve dans un seul site: la spécification du modèle est (1 | SITE/BROOD/INDEX)lue comme «poussin (INDEX) imbriqué dans la couvée imbriqué dans le site» ou de façon équivalente (1 | SITE) + (1 | SITE:BROOD) + (1 | SITE:BROOD:INDEX). Si les couvées et les poussins sont étiquetés de manière unique, afin que le logiciel puisse détecter la nidification, (1 | SITE) + (1 | BROOD) + (1 | INDEX)cela fonctionnera également (ne pas utiliser (1 | SITE) + (1 | SITE/BROOD) + (1 | SITE/BROOD/INDEX); cela conduira à des termes redondants dans le modèle).

D'autres pensées:

  • plus d'informations sur l'imbrication et les spécifications du modèle sur http://glmm.wikidot.com/faq
  • vos traitements d'irrigation sont-ils vraiment organisés comme indiqué dans le schéma ci-dessus, c'est-à-dire non entrecoupés? Ou est-ce juste pour la commodité de la présentation graphique? Si le premier, alors vous avez une conception expérimentale potentiellement problématique ...
  • Étant donné que les sous-parcelles sont imbriquées dans les sites, il serait très bien inférentiellement (suivant Murtaugh 2007 Ecology "Simplicity and complex in écologique data data analysis" ) de prendre les moyennes des parcelles et d'analyser les données au niveau des parcelles.
  • Pour ce que ça vaut, je pense que vous pourriez aller encore plus loin et agréger au niveau de l'intrigue; alors vous pouvez ignorer complètement les modèles mixtes et fairelm(y~treatment*irrigation, data=my_aggregated_data)
Ben Bolker
la source
merci pour votre aide (j'ai 12h à attendre pour débloquer le +50 :( en effet j'étais en grand doute concernant la dénomination de mes sous-parcelles (4 ou 64 étiquettes uniques). Le chiffre est correct: l'irrigation n'est pas "randomisée", c'est malheureux je suis d'accord (ils m'ont dit: "trop ​​cher pour le faire différemment"!). Merci pour les liens. Une autre question: j'ai un tracé des résidus qui ne semble pas bon: en forme de cône (comme ceci: "<"), erreur semble proportionnelle aux valeurs Y. y a-t-il un moyen de corriger cela dans ce type de modèle?
agenis
1
La solution la plus évidente (et qui résout souvent d'autres problèmes) est de transformer la réponse, le plus souvent la transformation du journal.
Ben Bolker