Ma question est très étroitement liée à un poste précédent Spécifier le terme d' erreur () dans des mesures répétées ANOVA dans R . Cependant, j'aimerais avoir plus d'informations sur la façon de définir le terme d'erreur.
Supposons que j'ai une ANOVA répétée dans les deux sens, le facteur de l'effet entre les groupes est le traitement (contrôle vs placebo), tandis que le temps est l'effet intra-groupe mesuré plusieurs fois plus de 4 fois (T1 ~ T4). L'identification des patients est enregistrée en tant que sujet. Ici, j'ai emprunté les données d'un exemple du didacticiel de http://gjkerns.github.io/R/2012/01/20/power-sample-size.html pour que les données ressemblent à ceci
Time Subject Method NDI
0min 1 Treat 51.01078
15min 1 Treat 47.12314
48hrs 1 Treat 26.63542
96hrs 1 Treat 20.78196
0min 2 Treat 42.61345
15min 2 Treat 32.77171
Pour appliquer l'ANOVA:
aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Subject:Time
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
J'ai également essayé l'autre terme d'erreur:
aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Quelqu'un peut-il m'aider à expliquer les différences entre ces deux termes d'erreur? Si le premier terme est le bon, que signifient les résultats du deuxième terme d'erreur?
Mise à jour par @amoeba: Les deux sorties sont les mêmes donc il semble que dans ce cas il n'y a pas de différence, mais la question reste de savoir quelle est la différence de principe . Sont Error(subject)
et Error(subject/time)
toujours la même chose?
la source
time
), alorsError(subject)
etError(subject/time)
cela produira des valeurs F et p différentes pourtime
.Réponses:
Tout d'abord, la
subject/time
notation esttime
imbriquée danssubject
, et se développe donc en deux parties,subject
et l'subject:time
interaction. Ainsi, la question devient plus correctement, quand faut-il spécifier l'subject:time
interaction, et quelle différence cela fait-il?Avant de répondre à cette question, une autre chose importante à réaliser est que tous les modèles incluent un terme d'erreur supplémentaire qui n'a pas besoin d'être spécifié, qui est le terme d'erreur associé aux mesures individuelles (le niveau le plus bas, si vous y réfléchissez hiérarchiquement).
Dans ce cas, l'
subject:time
interaction est le niveau le plus bas, qui est toujours inclus dans le modèle. Donc, utilisezError(subject)
etError(subject/time)
donnez le même résultat; la seule différence est que dans la sortie, ce niveau de résultats est appeléWithin
pour le premier et est appelésubject:time
pour le second.Cependant, dans les cas où il y a plusieurs mesures à chaque
subject/time
combinaison, il est nécessaire de spécifier l'subject:time
interaction, car alors cette interaction n'est pas au niveau le plus bas.la source
subject/time
combinaison, pourquoi devrions-nous nécessairement vous voulez tester l'effet detime
relatif à l'subject:time
interaction? C'est essentiellement le contenu de ma question ici stats.stackexchange.com/questions/286280 , donc j'invite tous les futurs lecteurs de ce fil à y chercher une justification conceptuelle.