Le titre dit tout, et je suis confus. Ce qui suit exécute une mesure répétée aov () dans R, et exécute ce que je pensais être un appel lm () équivalent, mais ils renvoient des résidus d'erreur différents (bien que les sommes des carrés soient les mêmes).
Il est clair que les valeurs résiduelles et ajustées de aov () sont celles utilisées dans le modèle, car leurs sommes de carrés s'ajoutent à chacune des sommes de carrés / modèle rapportées en résumé (my.aov). Quels sont donc les modèles linéaires réels qui sont appliqués à un plan de mesures répétées?
set.seed(1)
# make data frame,
# 5 participants, with 2 experimental factors, each with 2 levels
# factor1 is A, B
# factor2 is 1, 2
DF <- data.frame(participant=factor(1:5), A.1=rnorm(5, 50, 20), A.2=rnorm(5, 100, 20), B.1=rnorm(5, 20, 20), B.2=rnorm(5, 50, 20))
# get our experimental conditions
conditions <- names(DF)[ names(DF) != "participant" ]
# reshape it for aov
DFlong <- reshape(DF, direction="long", varying=conditions, v.names="value", idvar="participant", times=conditions, timevar="group")
# make the conditions separate variables called factor1 and factor2
DFlong$factor1 <- factor( rep(c("A", "B"), each=10) )
DFlong$factor2 <- factor( rep(c(1, 2), each=5) )
# call aov
my.aov <- aov(value ~ factor1*factor2 + Error(participant / (factor1*factor2)), DFlong)
# similar for an lm() call
fit <- lm(value ~ factor1*factor2 + participant, DFlong)
# what's aov telling us?
summary(my.aov)
# check SS residuals
sum(residuals(fit)^2) # == 5945.668
# check they add up to the residuals from summary(my.aov)
2406.1 + 1744.1 + 1795.46 # == 5945.66
# all good so far, but how are the residuals in the aov calculated?
my.aov$"participant:factor1"$residuals
#clearly these are the ones used in the ANOVA:
sum(my.aov$"participant:factor1"$residuals ^ 2)
# this corresponds to the factor1 residuals here:
summary(my.aov)
# but they are different to the residuals reported from lm()
residuals(fit)
my.aov$"participant"$residuals
my.aov$"participant:factor1"$residuals
my.aov$"participant:factor1:factor2"$residuals
participant
, comme dansanova(lm(value ~ factor1*factor2*participant, DFlong))
Réponses:
Une façon de penser est de traiter la situation comme un 3-factoriel entre les sujets ANOVA avec IVs
participant
,factor1
,factor2
et une taille de cellule de 1.anova(lm(value ~ factor1*factor2*participant, DFlong))
calcule tous les SS pour tous les effets de cette 3 ANOVA (3 effets principaux, 3 interactions de premier ordre, 1 interaction de second ordre). Puisqu'il n'y a qu'une seule personne dans chaque cellule, le modèle complet n'a pas d'erreurs et l'appel ci-dessus àanova()
ne peut pas calculer les tests F. Mais les SS sont les mêmes que dans la conception à 2 facteurs.Comment
anova()
calcule- t-on réellement le SS pour un effet? Par le biais de comparaisons de modèles séquentiels (type I): il s'adapte à un modèle restreint sans l'effet en question, et à un modèle non restreint qui inclut cet effet. Le SS associé à cet effet est la différence d'erreur SS entre les deux modèles.Vérifions maintenant l'effet SS associé à l'interaction
id:IV1
en soustrayant l'erreur SS du modèle non restreint de l'erreur SS du modèle restreint.Maintenant que vous disposez de tous les SS d'effet "bruts", vous pouvez créer les tests intra-sujets simplement en choisissant le terme d'erreur correct pour tester un SS d'effet. Par exemple, tester l'effet SS par
factor1
rapport à l'effet d'interaction SS departicipant:factor1
.Pour une excellente introduction à l'approche de comparaison de modèles, je recommande Maxwell & Delaney (2004). Conception d'expériences et analyse de données.
la source