Comment interpréter une ANOVA et une MANOVA de types I, II et III?

45

Ma question principale est de savoir comment interpréter la sortie (coefficients, F, P) lors d’une analyse de variance de type I (séquentielle)?

Mon problème de recherche spécifique est un peu plus complexe, je vais donc décomposer mon exemple en plusieurs parties. Premièrement, si je suis intéressé par l’effet de la densité de l’araignée (X1) sur la croissance des plantes (Y1) et que j’ai planté des plants dans des enclos et manipulé la densité de l’araignée, je peux analyser les données avec une simple analyse de variance ou une régression linéaire. Dans ce cas, peu importe si j'utilise la somme des carrés (SS) de types I, II ou III pour mon ANOVA. Dans mon cas, j'ai 4 répétitions de 5 niveaux de densité, je peux donc utiliser la densité comme facteur ou comme variable continue. Dans ce cas, je préfère l’interpréter comme une variable continue (prédicteur) indépendante. Dans RI peut exécuter ce qui suit:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

Exécuter la fonction anova aura du sens pour une comparaison ultérieure, espérons-le, alors ignorez-le ici. La sortie est:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

Maintenant, supposons que je soupçonne que le niveau de départ d’azote inorganique dans le sol, que je ne pouvais pas contrôler, aurait également affecté de manière significative la croissance de la plante. Je ne suis pas particulièrement intéressé par cet effet, mais j'aimerais potentiellement rendre compte de la variation qu'il provoque. En réalité, mon intérêt principal porte sur les effets de la densité des araignées (hypothèse: une augmentation de la densité des araignées entraîne une augmentation de la croissance des plantes - vraisemblablement par la réduction des insectes herbivores mais je ne teste que l'effet et pas le mécanisme). Je pourrais ajouter l'effet de l'azote inorganique à mon analyse.

Pour les besoins de ma question, supposons que je teste la densité d'interaction * inorganique et qu'elle est non significative. Je la supprime donc de l'analyse et exécute les principaux effets suivants:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

Maintenant, le fait que j'utilise le SS de type I ou de type II fait une différence (je sais que certaines personnes s'opposent aux termes types I et II, etc., mais étant donné la popularité de SAS, c'est un raccourci facile). R anova {stats} utilise le type I par défaut. Je peux calculer les densités de type II SS, F et P en inversant l'ordre de mes effets principaux ou utiliser le package "car" du Dr. John Fox (accompagnement de la régression appliquée). Je préfère cette dernière méthode car elle est plus facile pour les problèmes plus complexes.

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

D'après ce que je comprends, les hypothèses de type II seraient les suivantes: "Il n'y a pas d'effet linéaire de x1 sur y1 étant donné l'effet de (maintien constant?) X2" et il en va de même pour x2 étant donné x1. Je suppose que c'est là que je me perds. Quelle est l'hypothèse testée par l'ANOVA en utilisant la méthode de type I (séquentielle) ci-dessus par rapport à l'hypothèse en utilisant la méthode de type II?

En réalité, mes données sont un peu plus complexes, car j’ai mesuré de nombreuses mesures de la croissance des plantes ainsi que de la dynamique des éléments nutritifs et de la décomposition de la litière. Mon analyse actuelle est quelque chose comme:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           
djhocking
la source

Réponses:

71

nn11n12n21n22r=.1r«significatif», c’est toute la population qui compte pour vous). Le problème avec vos facteurs étant en corrélation est qu'il ya des sommes des carrés qui sont associés à la fois A et B. Lors du calcul d' une analyse de variance (ou tout autre régression linéaire), nous voulons répartir les sommes des carrés. Une partition met toutes les sommes des carrés en un et un seulde plusieurs sous-ensembles. (Par exemple, nous pourrions vouloir diviser le SS en A, B et erreur.) Cependant, étant donné que vos facteurs (toujours uniquement A et B ici) ne sont pas orthogonaux, il n’existe pas de partition unique de ces SS. En fait, il peut y avoir de très nombreuses partitions, et si vous êtes prêt à diviser votre SS en fractions (par exemple, "Je mettrai .5 dans ce bac et .5 dans celui-ci"), il y a une infinité de partitions. Une façon de visualiser cela consiste à imaginer le symbole MasterCard: le rectangle représente le total des SS, et chacun des cercles représente les SS attribuables à ce facteur, mais notez le chevauchement entre les cercles au centre, ces SS pourraient être donnés à l'un ou l'autre cercle.

entrez la description de l'image ici

La question qui se pose est de savoir comment choisir la «bonne» partition parmi toutes ces possibilités. Ramenons l'interaction et discutons de quelques possibilités:

Type I SS:

  • SS (A)
  • SS (B | A)
  • SS (A * B | A, B)

Type II SS:

  • SS (A | B)
  • SS (B | A)
  • SS (A * B | A, B)

Type III SS:

  • SS (A | B, A * B)
  • SS (B | A, A * B)
  • SS (A * B | A, B)

Remarquez comment fonctionnent ces différentes possibilités. Seul le type I SS utilise réellement ces SS dans la partie qui se chevauche entre les cercles du symbole MasterCard. En d'autres termes, les SS pouvant être attribués à A ou à B sont en fait attribués à l'un d'eux lorsque vous utilisez un SS de type I (en particulier, celui que vous avez entré en premier dans le modèle). Dans les deux autres approches, les SS qui se chevauchent ne sont pas utilisés du tout . Ainsi, le type I SS donne à A tous les SS attribuables à A (y compris ceux qui auraient également pu être attribués ailleurs), puis à B, tous les SS restants attribuables à B, puis à l’interaction A * B tous du resteSS qui sont attribuables à A * B et laisse les restes impossibles à attribuer au terme d'erreur.

Le type III SS ne donne à A que les SS uniquement attribuables à A, de même qu’il ne donne qu’à B et à l’interaction ces SS qui leur sont uniquement attribuables. Le terme d'erreur n'obtient que les SS qui ne peuvent être attribués à aucun des facteurs. Ainsi, les SS «ambigus» pouvant être attribués à 2 possibilités ou plus ne sont pas utilisés. Si vous faites la somme des SS de type III dans une table ANOVA, vous remarquerez qu’elles ne sont pas égales au SS total. En d’autres termes, cette analyse doit être fausse, mais se tromper d’une manière conservatrice sur le plan épistémique. De nombreux statisticiens trouvent cette approche flagrante, mais les agences de financement gouvernementales (je pense que la FDA) en ont besoin.

L’approche de type II vise à cerner ce qui pourrait valoir l’intérêt de l’idée sous-jacente au type III, mais à en atténuer les excès. Plus précisément, il règle uniquement le SS pour A et B l'un pour l'autre, pas pour l'interaction. Cependant, dans la pratique, les SS de type II ne sont pratiquement jamais utilisés. Vous devez avoir connaissance de tout cela et être suffisamment averti avec votre logiciel pour obtenir ces estimations, et les analystes qui le pensent pensent généralement que c'est de la foutaise.

Il y a plus de types de SS (je crois IV et V). Ils ont été suggérés à la fin des années 60 pour traiter certaines situations, mais il a été démontré par la suite qu'ils ne faisaient pas ce qu'ils pensaient. Ainsi, à ce stade, ils ne sont qu’une note de bas de page historique.

En ce qui concerne les questions auxquelles ils répondent, vous avez déjà ce droit dans votre question:

  • Les estimations utilisant le type I SS vous indiquent dans quelle mesure la variabilité de Y peut être expliquée par A, dans quelle mesure la variabilité résiduelle peut-elle être expliquée par B, dans quelle mesure la variabilité résiduelle résiduelle peut-elle être expliquée par l’interaction, et ainsi de suite, dans l'ordre .
  • Les estimations basées sur le type III SS vous indiquent quelle part de la variabilité résiduelle dans Y peut être prise en compte par A après avoir pris en compte tout le reste, et quelle part de la variabilité résiduelle dans Y peut être prise en compte par B après avoir pris en compte tout le reste ainsi, et ainsi de suite. (Notez que les deux vont en même temps en premier et en dernier; si cela vous semble logique et reflète avec précision votre question de recherche, utilisez alors un SS de type III.)
gung - Rétablir Monica
la source
2
merci pour la réponse très utile. L’autre domaine dans lequel je suis confus est que "si les estimations utilisant le type I SS vous indiquent quelle part de la variabilité en Y peut être expliquée par A, quelle part de la variabilité résiduelle peut-elle être expliquée par B, quelle part de la la variabilité peut être expliquée par l'interaction, et ainsi de suite, dans l'ordre, "alors pourquoi les statistiques sont-elles associées à A changement lorsque des variables supplémentaires sont ajoutées? Est-ce parce que les tests sont basés sur SS (A) / SS (erreur) et que l'erreur est fonction de tous les termes du modèle? Est-ce que je pense à cela correctement?
djhocking le
1
Par "statistiques associées à A", je suppose que vous entendez les valeurs F et p de l'effet principal de A. La valeur F de A est le rapport entre le carré moyen de A (SSA / dfA) et le Erreur MS. Au fur et à mesure que vous ajoutez d'autres facteurs, les SS sont tirés du terme d'erreur et attribués à ces facteurs. En général, cela signifie que l’erreur MS diminue, et donc le ratio augmente. En conséquence, la valeur F pour A devient plus grande et la valeur p devient plus petite. Parce que les degrés de liberté changent aussi, cela peut être plus compliqué que cela, mais c'est l'essentiel.
gung - Rétablir Monica
Oups, je voulais dire MS (A) / MSE pour la statistique F. Quoi qu'il en soit, votre réponse est parfaite, merci encore pour toute votre aide!
djhocking
Je suis curieux de connaître les détails d’interprétation lorsqu’on utilise un type I. Dans mon cas, la densité est ma seule variable d’intérêt et la seule que j’ai manipulée de manière expérimentale. Malheureusement, la densité est insignifiante seule ou après la prise en compte de mes deux autres variables d’intérêt (Npredators, inorganicN de type II ou III). Mais parce qu'inorganicN semble expliquer en grande partie la variation de certaines des variables dépendantes lorsque je l’ajoute comme 3ème variable, les 2 autres sont hautement significatives. Par conséquent, la densité a-t-elle vraiment un effet significatif sur Y? Est-ce raisonnable?
djhocking le
2
@JonBonJovi, l'analogie de MasterCard n'a que 2 facteurs. Si vous voulez 2 facteurs plus une interaction, alors vous aurez besoin de 3 zones qui se chevauchent quelque peu. Il est certainement possible de dessiner un diagramme d'Euler avec 3 zones, mais je viens d'utiliser le symbole MasterCard pour plus de simplicité. Pour une interaction, imaginez un troisième cercle qui chevauche les deux premiers (par exemple, il pourrait être centré de droite à gauche, mais surtout au-dessus des autres); alors tout le cercle A (SS) ira à A, tout ce qui en B ne chevauche pas A va à B et tout ce qui en A B ne chevauche pas *, A ou B passe à l'interaction.
gung - Réintégrer Monica