Je souhaite effectuer une analyse ANCOVA des données concernant la densité des épiphytes végétaux. Dans un premier temps, je voudrais savoir s'il existe une différence de densité de plante entre deux pentes, une N et une S, mais j'ai d'autres données telles que l'altitude, l'ouverture du couvert et la hauteur de la plante hôte. Je sais que ma covariable devrait être les deux pentes (N et S). J'ai construit ce modèle qui fonctionne en R et bien que je ne sache pas s'il fonctionne bien. J'aimerais aussi savoir quelle est la différence si j'utilise le symbole +
ou *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Réponses:
L'outil de base pour cela est
lm
; notez queaov
c'est un wrapper pourlm
.En particulier, si vous avez une variable de regroupement (facteur),g et une covariable continueX , le modèle
y ~ x + g
correspondrait à un modèle ANCOVA à effets principaux, tandisy ~ x * g
qu'il s'adapterait à un modèle qui inclut l'interaction avec la covariable.aov
prendra les mêmes formules.Portez une attention particulière
Note
à l'aide dansaov
.Pour ce qui est de
+
vs*
, russellpierce à peu près couvertures, mais je vous recommande de regarder?lm
et?formula
et plus particulièrement l' article 11.1 du manuel Introduction à R qui vient avec R (ou vous pouvez le trouver en ligne si vous ne l' avez pas compris comment pour le trouver sur votre ordinateur, le plus facilement, cela implique de trouver le menu déroulant "Aide" dans R ou RStudio).la source
anova
(vous verrez bientôt si vous les donnez dans le mauvais ordre car certains SS seront négatifs si vous le faites) )Je recommande d'obtenir et de lire Découvrir les statistiques à l'aide de R par champ. Il a une belle section sur ANCOVA.
Pour exécuter ANCOVA dans R, chargez les packages suivants:
Si vous utilisez
lm
ouaov
(j'utiliseaov
) assurez-vous de régler les contrastes à l'aide de la fonction "contrastes" avant de faire soitaov
oulm
. R utilise par défaut des contrastes non orthogonaux qui peuvent tout gâcher dans une ANCOVA. Si vous souhaitez définir des contrastes orthogonaux, utilisez:puis exécutez votre modèle en tant que
Pour afficher l'utilisation du modèle:
Assurez-vous d'utiliser le "A" majuscule
Anova
ici et nonanova
. Cela donnera des résultats en utilisant le SS de type III.summary.lm(model.1)
donnera un autre résumé et comprend le R-sq. production.Si vous souhaitez tester l'homogénéité des pentes de régression, vous pouvez également inclure un terme d'interaction pour IV et covariable. Ce serait:
Si le terme d'interaction est significatif, vous n'avez pas d'homogénéité.
la source
Voici une documentation complémentaire http://goo.gl/yxUZ1R de la procédure proposée par @Butorovich. De plus, mon observation est que lorsque la covariable est binaire, l'utilisation de résumé (lm.object) donnerait la même estimation IV que celle générée par Anova (lm.object, type = "III").
la source
ASK QUESTION
sur le haut et posez-la là. Ensuite, nous pouvons vous aider correctement.Nous utilisons l'analyse de régression pour créer des modèles qui décrivent l'effet de la variation des variables prédictives sur la variable de réponse. Parfois, si nous avons une variable catégorielle avec des valeurs comme Oui / Non ou Masculin / Féminin, etc., l'analyse de régression simple donne plusieurs résultats pour chaque valeur de la variable catégorielle. Dans un tel scénario, nous pouvons étudier l'effet de la variable catégorielle en l'utilisant avec la variable prédictive et en comparant les lignes de régression pour chaque niveau de la variable catégorielle. Une telle analyse est appelée analyse de covariance également appelée ANCOVA.
Exemple
Considérez l'
R
ensemble de données intégrémtcars
. Nous y observons que le champam
représente le type de transmission (automatique ou manuelle). Il s'agit d'une variable catégorielle avec les valeurs 0 et 1. La valeur en miles par gallon (mpg
) d'une voiture peut également en dépendre en plus de la valeur de la puissance en chevaux (hp
). Nous étudions l'effet de la valeur deam
sur la régression entrempg
ethp
. Cela se fait en utilisant laaov()
fonction suivie de laanova()
fonction pour comparer les régressions multiples.Les données d'entrée
Créer une trame de données contenant les champs
mpg
,hp
etam
de l'ensemble de donnéesmtcars
. Ici, nous prenonsmpg
comme variable de réponse,hp
comme variable prédictive etam
comme variable catégorielle.Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant:
Analyse ANCOVA
Nous créons un modèle de régression en prenant
hp
comme variable prédictive etmpg
comme variable de réponse en tenant compte de l'interaction entream
ethp
.Modèle avec interaction entre variable catégorielle et variable prédictive
Créer un modèle de régression1
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant:
Ce résultat montre que la puissance en chevaux et le type de transmission ont un effet significatif sur les miles par gallon car la valeur p dans les deux cas est inférieure à 0,05. Mais l'interaction entre ces deux variables n'est pas significative car la valeur de p est supérieure à 0,05.
Modèle sans interaction entre variable catégorielle et variable prédictive
Créer le modèle de régression2
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant:
Ce résultat montre que la puissance en chevaux et le type de transmission ont un effet significatif sur les miles par gallon car la valeur p dans les deux cas est inférieure à 0,05.
Comparaison de deux modèles
Maintenant, nous pouvons comparer les deux modèles pour conclure si l'interaction des variables est vraiment insignifiante. Pour cela, nous utilisons la
anova()
fonction.Comme la valeur de p est supérieure à 0,05, nous concluons que l'interaction entre la puissance en chevaux et le type de transmission n'est pas significative. Ainsi, le kilométrage par gallon dépendra de manière similaire de la puissance en chevaux de la voiture en mode de transmission automatique et manuelle.
la source