Puis-je obtenir de l'aide pour terminer cette tentative (en cours) de tentative de repérage sur les équivalents ANOVA et REGRESSION? J'ai essayé de concilier les concepts, la nomenclature et la syntaxe de ces deux méthodologies. Il existe de nombreux messages sur ce site concernant leur similitude, par exemple ceci ou cela , mais il est toujours bon d'avoir une carte rapide "vous êtes ici" au début.
J'ai l'intention de mettre à jour ce message et j'espère obtenir de l'aide pour corriger les erreurs.
ANOVA unidirectionnelle:
Structure: DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario: miles-per-gal. vs cylinders
Note that Income vs Gender (M, F) is a t-test.
Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANOVA bidirectionnelle:
Structure: DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario: mpg ~ cylinders & carburators
Syntax: fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANOVA factorielle bidirectionnelle:
Structure: All possible COMBINATIONS of LEVELS are considered.
Scenario: mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax: fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANCOVA:
Structure: DV continuous ~ Factor and continuous COVARIATE.
Scenario: mpg ~ cylinders + weight
Syntax: fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars)
# with F dummy coded;
summary(fit); anova(fit)
MANOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario: mpg and wt ~ cylinders
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression: N/A
MANCOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario: mpg and wt ~ cyl + displacement (cubic inches)
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression: N/A
DANS L'ANOVA DU FACTEUR (OU SUJET): ( coder ici )
Structure: DV continuous ~ FACTOR with each level * with subject (repeated observations).
Extension paired t-test. Each subject measured at each level multiple times.
Scenario: Memory rate ~ Emotional value of words for Subjects @ Times
Syntax: fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data);
summary(fit); print(model.tables(fit, "means"), digits=3);
boxplot(Recall_Rate ~ Emtl_Value, data=data)
with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
summary(fit); anova(fit); coefficients(fit); confint(fit)
SPLIT-PLOT: ( code ici )
Structure: DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario: Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer
& RANDOM EFFECTS (Blocks and plots of land):
Syntax: fit <- aov(yield ~ irrigation * density * fertilizer +
Error(block/irrigation/density), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest);
fit <- lmer(yield ~ irrigation * fertilizer +
(1|block/irrigation/density), data = splityield);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
library(nlme)
fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
summary(fit); anova(fit)
DESIGN IMPRIMÉ: ( code ici )
Structure: DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario: [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect:
Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide).
Syntax: fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
summary(fit); anova(fit); VarCorr(fit)
SITES UTILES:
regression
anova
mixed-model
Antoni Parellada
la source
la source
cyl + hp
. Horespower est continue, donc ne fonctionne pas ici.carb
, le nombre de carburateurs serait un meilleur choix.Réponses:
Belle liste, Antoni. Voici quelques suggestions mineures:
ANOVA à sens unique: IV est un FACTEUR avec 3 niveaux ou plus. Vous pouvez également ajouter un exemple de données: mtcars à cette entrée. (De même, vous pouvez ajouter des instructions * Example Data "à toutes vos entrées, pour clarifier les ensembles de données que vous utilisez.)
Anova bidirectionnelle: Pourquoi ne pas utiliser IV1 et IV2 et déclarer que les deux variables indépendantes devraient être des facteurs d'au moins deux niveaux chacun? La façon dont vous avez déclaré cela suggère actuellement qu'une anova bidirectionnelle pourrait inclure plus de 2 variables (ou facteurs) indépendants, ce qui n'est pas sensible.
Pour Anova bidirectionnel, je distinguerais ces deux sous-cas: 1. Anova bidirectionnel avec effets principaux pour IV1 et IV2 et 2. Anova bidirectionnel avec une interaction entre IV1 et IV2. Ce deuxième élément est ce que vous appelez deux en tant qu'anova factorielle bidirectionnelle.) Une meilleure façon de décrire ces deux sous-cas serait: 1. L'effet d'IV1 sur DV est indépendant de l'effet d'IV2 et 2. L'effet d'IV1 sur DV dépend d'IV2. Vous pouvez également préciser que ce sont les variables indépendantes IV1 et IV2 qui sont codées de manière fictive dans le paramètre de régression.
Pour l'ANCOVA, vous pouvez préciser que vous ne considérez que l'ANCOVA unidirectionnelle dans votre exemple actuel. Pour être complet, vous pouvez ajouter un exemple ANCOVA bidirectionnel sans interaction entre IV1 et IV2, et un avec interaction entre ces deux variables.
Pour tout ce qui précède, vous pouvez également ajouter un élément appelé Objectif , qui décrit quand ces analyses sont utiles. Par exemple:
Objectif (de l'anova unidirectionnelle): vérifier si les valeurs moyennes de la DV sont différentes d'un niveau à l'autre du IV.
Pour MANOVA, pouvez-vous préciser qu'il faudrait (a) deux DV ou plus et (2) un ou plusieurs IV qui sont des facteurs? Je suppose que vous pouvez faire la différence entre la MANOVA unidirectionnelle (avec 1 facteur) et la MANOVA bidirectionnelle? Même chose pour MANCOVA.
L'ANOVA À FACTEUR INTÉGRÉ est également connue sous le nom d'ANOVA À MESURES RÉPÉTÉES, vous pouvez donc peut-être ajouter cette terminologie à votre liste pour ceux qui la connaissent. Il serait également utile de clarifier que la modélisation à effets mixtes offre un autre moyen de modéliser les données de mesures répétées. Sinon, les lecteurs pourraient ne pas apprécier la différence entre les deux approches.
la source