Nested / SplitModel - RepeatedMeasures / MixedModel ANOVA: niveaux d'imbrication et de script dans R

8

Mon ensemble de données comporte les variables suivantes:

  • Traitement (4 types - fixe)
  • Emplacement (8 emplacements - fixe)
  • Position dans l'emplacement (3 positions par emplacement - fixe)
  • Des échantillons sont prélevés dans chaque position (3 échantillons par position aléatoire)
    • Heure (deux heures d'échantillonnage - fixe)
    • Taux de minéralisation (résultant de l'analyse des échantillons prélevés)

Deux emplacements sont utilisés pour tester chaque traitement (soit 4 traitements, 2 emplacements par traitement, 8 emplacements au total).

Je veux faire une ANOVA à mesures répétées (/ imbriquée?) (/ Modèle mixte?) En Rutilisant les variables ci-dessus.

Q.1. Est-ce que cela vous convient?

Mon objectif est de voir s'il y a un effet de 1) position, 2) traitement, 3) temps et 4) interaction de tous (c.-à-d. Pos * traiter *, pos * temps, traiter * temps, pos * traiter * temps) sur taux de minéralisation.

Q 2. L'endroit est-il imbriqué dans le traitement? L'échantillon est-il imbriqué en position?

Q 3. Quels sont les facteurs entre et à l'intérieur?

Q 4. Quel est le sujet / l'intrigue? - Est-ce l'emplacement ou la position ou l'échantillon ou le taux?

Q 5. Comment puis-je mettre le temps en tant que mesures répétées dans ma formule R?

Q 6. Utiliseriez-vous aov, lme ou ezANOVA?

Q 7. Comment puis-je coder les variables indépendantes séparées et leurs interactions dans une formule R appropriée?

J'essaie littéralement de comprendre cela depuis des jours et je n'arrive pas à trouver une réponse qui ait du sens ...

Lorain
la source
2
Vous mentionnez deux temps d'échantillonnage comme mesures répétées, mais votre description des variables ne semble pas l'inclure.
mnel
merci pour le commentaire, je l'ai édité. j'espère que c'est plus clair!
Lorain

Réponses:

7

Problème délicat! L'emplacement est-il fixe ou aléatoire? La position est-elle fixe ou aléatoire? Je suppose que cet échantillon est aléatoire.

  • Étant donné que le traitement est attribué à l'emplacement, l'emplacement est l'unité d'échantillonnage. Fondamentalement, la comparaison entre les traitements se fait à ce niveau. .n=8
  • L'unité de mesure est l'observation que vous effectuez sur vos «échantillons» à un instant donné.
  • L'emplacement n'est pas imbriqué dans le traitement. Le traitement est appliqué à l'emplacement.
  • La position est imbriquée à l'intérieur de l'emplacement.
  • L'échantillon est imbriqué à l'intérieur de la position.
  • Le temps est imbriqué dans Sample.
  • Le temps est croisé avec le traitement.

Vous avez 3 niveaux d'imbrication (temps dans l'échantillon, échantillon dans la position, position dans l'emplacement).

Si l'emplacement, la position et l'échantillon sont aléatoires, je pense que la formule R ressemblera à ceci:

 Y ~ Treatment * Time +(1|location|position|sample)

Vous avez 1 ligne dans votre bloc de données pour chaque observation d'échantillon à chaque fois - avec des codages appropriés pour toutes vos caractéristiques de conception.

Serait-il possible de combiner les mesures répétées en un score tel que leur moyenne ou leur différence? Cela pourrait rendre le modèle plus facile à interpréter.

Placidia
la source
1
+1, c'est une très belle réponse! Une chose que je me demande: vous dites qu'il y a "3 niveaux d'imbrication (emplacement, position, échantillon)" et aussi que "le temps est imbriqué dans Sample". Il y a un peu de tension entre ces déclarations. Existe-t-il un moyen de rendre cela plus clair pour moi?
gung - Rétablir Monica
1
Merci pour la mention élogieuse. Le temps est le dernier niveau du modèle, vous avez donc le temps <échantillon <position <emplacement. Mais j'ai remarqué que la «fin de la ligne» dans un modèle à effets aléatoires n'est généralement pas appelée «niveau». Dans un modèle à moyennes simples , le terme d'erreur est un effet aléatoire, mais nous ne parlons pas d'un tel modèle comme ayant un niveau d'imbrication. C'est juste de la sémantique à ce stade. J'ai changé le libellé pour le rendre plus clair. X=μ+ϵ
Placidia
@Placidia, merci beaucoup pour votre réponse! Cela m'a déjà beaucoup aidé. Sur la base de votre réponse, j'ai modifié ma question pour inclure un peu plus d'informations (par exemple, des variables fixes). J'avais une question à propos de votre formule R: le temps de traitement * signifie que vous ne recherchez que l'effet de la combinaison du traitement avec le temps non? Je suis également intéressé si la position a un effet. Comment ajouter cela à la formule?
Lorain
1
Avec R, j'utiliserais lmer du paquet lme4. lme (de nlme) est une version antérieure de ce paquet. Les formules sont définies de manières légèrement différentes. le temps de traitement * comprend les effets fixes du traitement et du temps ainsi que leur interaction.
Placidia
1
Si l'emplacement et la position sont aléatoires, vous pouvez toujours tester leur effet avec lmer et la formule que j'ai donnée. Dans ce cas, vous testez si la variance de ces composants est> 0. Si l'emplacement et la position sont fixes, une formule différente est nécessaire. Vous voudrez peut-être lire une introduction aux modèles mixtes avant d'aller plus loin, car ils peuvent être délicats.
Placidia