J'ai 2 variables dépendantes (DV) dont chacune des notes peut être influencée par l'ensemble des 7 variables indépendantes (IV). Les DV sont continus, alors que l'ensemble des IV consiste en un mélange de variables codées continues et binaires. (Dans le code ci-dessous, les variables continues sont écrites en majuscules et les variables binaires en minuscules.)
Le but de l’étude est de découvrir comment ces variables sont influencées par les variables des solutions intraveineuses. J'ai proposé le modèle de régression multiple multivariée (MMR) suivant:
my.model <- lm(cbind(A, B) ~ c + d + e + f + g + H + I)
Pour interpréter les résultats, j'appelle deux déclarations:
summary(manova(my.model))
Manova(my.model)
Les sorties des deux appels sont collées ci-dessous et sont considérablement différentes. Quelqu'un peut-il s'il vous plaît expliquer quelle déclaration parmi les deux devrait être choisie pour résumer correctement les résultats du ROR, et pourquoi? Toute suggestion serait grandement appréciée.
Sortie utilisant summary(manova(my.model))
statement:
> summary(manova(my.model))
Df Pillai approx F num Df den Df Pr(>F)
c 1 0.105295 5.8255 2 99 0.004057 **
d 1 0.085131 4.6061 2 99 0.012225 *
e 1 0.007886 0.3935 2 99 0.675773
f 1 0.036121 1.8550 2 99 0.161854
g 1 0.002103 0.1043 2 99 0.901049
H 1 0.228766 14.6828 2 99 2.605e-06 ***
I 1 0.011752 0.5887 2 99 0.556999
Residuals 100
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Sortie utilisant Manova(my.model)
statement:
> library(car)
> Manova(my.model)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
c 1 0.030928 1.5798 2 99 0.21117
d 1 0.079422 4.2706 2 99 0.01663 *
e 1 0.003067 0.1523 2 99 0.85893
f 1 0.029812 1.5210 2 99 0.22355
g 1 0.004331 0.2153 2 99 0.80668
H 1 0.229303 14.7276 2 99 2.516e-06 ***
I 1 0.011752 0.5887 2 99 0.55700
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
lm
fonction, je ne pratique la régression multivariée qu'en spécifiant plus d'une variable de respose à l'intérieur de lalm
fonction. J'ai appris qu'en utilisant lalm
fonction lorsque mes données sont réellement multivariées, donner un résultat erroné pour une erreur standard. Mais dans ce cas sous-estimera-my.model <- lm(cbind(A, B) ~ c + d + e + f + g + H + I);
tvcov(my.model )
-il l'erreur type oulm
ajustera-t-il intelligemment la corrélation entre les variables dépendantes?Eh bien, je n’ai toujours pas assez de points pour commenter la réponse précédente et c’est pourquoi je l’écris en tant que réponse séparée, alors veuillez me pardonner. (Si possible, veuillez me repasser les 50 points de repère;)
Voici donc les 2cents: Les tests d’erreurs des types I, II et III sont essentiellement des variations dues au déséquilibre des données. (Defn Unbalanced: ne pas avoir le même nombre d'observations dans chacune des strates). Si les données sont équilibrées, le test d'erreur des types I, II et III donne exactement les mêmes résultats.
Alors que se passe-t-il lorsque les données sont déséquilibrées?
Considérons un modèle qui comprend deux facteurs A et B; il y a donc deux effets principaux et une interaction, AB. SS (A, B, AB) indique le modèle complet SS (A, B) indique le modèle sans interaction. SS (B, AB) indique le modèle qui ne tient pas compte des effets du facteur A, etc.
Cette notation a maintenant un sens. Gardez cela à l'esprit.
Type I, aussi appelé somme "séquentielle" de carrés:
1)
SS(A) for factor A.
2)
SS(B | A) for factor B.
3)
SS(AB | B, A) for interaction AB.
Nous estimons donc l’effet principal de A d’abord, l’effet de B donné A, puis l’interaction AB donnée A et B (C’est là qu’il s’agit de données déséquilibrées, les différences s’inscrivent. puis interaction dans une "séquence")
Type II:
1)
SS(A | B) for factor A.
2)
SS(B | A) for factor B.
Le type II teste la signification de l'effet principal de A après B et B après A. Pourquoi n'y a-t-il pas de SS (AB | B, A)? La mise en garde est que la méthode de type II ne peut être utilisée que lorsque nous avons déjà testé que l'interaction est non significative. Etant donné qu'il n'y a pas d'interaction (SS (AB | B, A) n'est pas significatif), le test de type II a un meilleur pouvoir que celui de type III
Type III:
1)
SS(A | B, AB) for factor A.
2)
SS(B | A, AB) for factor B.
Nous avons donc testé l'interaction pendant le type II et l'interaction était significative. Nous devons maintenant utiliser le type III car il prend en compte le terme d'interaction.
Comme @caracal l'a déjà dit, lorsque les données sont équilibrées, les facteurs sont orthogonaux et les types I, II et III donnent tous les mêmes résultats. J'espère que ça aide !
Divulgation: La plupart de ce n'est pas mon propre travail. J'ai trouvé cette excellente page liée et j'ai eu l'impression de la réduire davantage pour la simplifier.
la source