Aide-mémoire ANOVA Alphabet Soup & Regression Equivalents

18

Puis-je obtenir de l'aide pour terminer cette tentative (en cours) de tentative de repérage sur les équivalents ANOVA et REGRESSION? J'ai essayé de concilier les concepts, la nomenclature et la syntaxe de ces deux méthodologies. Il existe de nombreux messages sur ce site concernant leur similitude, par exemple ceci ou cela , mais il est toujours bon d'avoir une carte rapide "vous êtes ici" au début.

J'ai l'intention de mettre à jour ce message et j'espère obtenir de l'aide pour corriger les erreurs.

ANOVA unidirectionnelle:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

ANOVA bidirectionnelle:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANOVA factorielle bidirectionnelle:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

DANS L'ANOVA DU FACTEUR (OU SUJET): ( coder ici )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( code ici )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

DESIGN IMPRIMÉ: ( code ici )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

SITES UTILES:

  1. RExRepos
  2. Projet de personnalité
  3. Quick-R
  4. R-Bloggers
  5. Analyse imbriquée et Split-Plot par M. Crawley
  6. Modèles avec plusieurs effets aléatoires
  7. Modèles de tracé partagé
  8. Le livre R de M. Crawley
  9. Au sein des groupes et des mesures répétées
  10. Répéter les mesures dans R
  11. FAQ GLMM
Antoni Parellada
la source
Une remarque: pour vos exemples d'ANOVA à 2 voies (rectilignes et factoriels), votre scénario / syntaxe est cyl + hp. Horespower est continue, donc ne fonctionne pas ici. carb, le nombre de carburateurs serait un meilleur choix.
Gregor --reinstate Monica--
Je vous remercie! Faute d'inattention. Grâce à votre note, j'ai également détecté que cyl était traité comme continu, je l'ai donc changé en as.factor. Et, j'ai inclus TukeyHSD.
Antoni Parellada
1
Je pense que vous devriez supprimer «Survival» du titre car c'est un domaine très spécifique des statistiques sans aucun rapport avec ce que vous résumez (très bien).
Bryan Hanson
Joli résumé Antoni! Peut-être pourriez-vous également ajouter les glmmFAQ de Ben Bolker et peut-être quelques exemples binomiaux et Poisson simples (GLM et GLMM). Mais je comprends que cela peut trop compliquer les choses et enlève de ce résumé agréable et concis. Vous pouvez également créer un lien vers des exemples sur ce site. Pour un exemple binomial Poisson / négatif simple et complet, cela peut fonctionner: stats.stackexchange.com/questions/325334/…
Stefan

Réponses:

2

Belle liste, Antoni. Voici quelques suggestions mineures:

ANOVA à sens unique: IV est un FACTEUR avec 3 niveaux ou plus. Vous pouvez également ajouter un exemple de données: mtcars à cette entrée. (De même, vous pouvez ajouter des instructions * Example Data "à toutes vos entrées, pour clarifier les ensembles de données que vous utilisez.)

Anova bidirectionnelle: Pourquoi ne pas utiliser IV1 et IV2 et déclarer que les deux variables indépendantes devraient être des facteurs d'au moins deux niveaux chacun? La façon dont vous avez déclaré cela suggère actuellement qu'une anova bidirectionnelle pourrait inclure plus de 2 variables (ou facteurs) indépendants, ce qui n'est pas sensible.

Pour Anova bidirectionnel, je distinguerais ces deux sous-cas: 1. Anova bidirectionnel avec effets principaux pour IV1 et IV2 et 2. Anova bidirectionnel avec une interaction entre IV1 et IV2. Ce deuxième élément est ce que vous appelez deux en tant qu'anova factorielle bidirectionnelle.) Une meilleure façon de décrire ces deux sous-cas serait: 1. L'effet d'IV1 sur DV est indépendant de l'effet d'IV2 et 2. L'effet d'IV1 sur DV dépend d'IV2. Vous pouvez également préciser que ce sont les variables indépendantes IV1 et IV2 qui sont codées de manière fictive dans le paramètre de régression.

Pour l'ANCOVA, vous pouvez préciser que vous ne considérez que l'ANCOVA unidirectionnelle dans votre exemple actuel. Pour être complet, vous pouvez ajouter un exemple ANCOVA bidirectionnel sans interaction entre IV1 et IV2, et un avec interaction entre ces deux variables.

Pour tout ce qui précède, vous pouvez également ajouter un élément appelé Objectif , qui décrit quand ces analyses sont utiles. Par exemple:

Objectif (de l'anova unidirectionnelle): vérifier si les valeurs moyennes de la DV sont différentes d'un niveau à l'autre du IV.

Pour MANOVA, pouvez-vous préciser qu'il faudrait (a) deux DV ou plus et (2) un ou plusieurs IV qui sont des facteurs? Je suppose que vous pouvez faire la différence entre la MANOVA unidirectionnelle (avec 1 facteur) et la MANOVA bidirectionnelle? Même chose pour MANCOVA.

L'ANOVA À FACTEUR INTÉGRÉ est également connue sous le nom d'ANOVA À MESURES RÉPÉTÉES, vous pouvez donc peut-être ajouter cette terminologie à votre liste pour ceux qui la connaissent. Il serait également utile de clarifier que la modélisation à effets mixtes offre un autre moyen de modéliser les données de mesures répétées. Sinon, les lecteurs pourraient ne pas apprécier la différence entre les deux approches.

Isabella Ghement
la source
Il est plus facile pour moi de faire des suggestions plutôt que de faire des modifications.🤗
Isabella Ghement