Comment utiliser anova pour comparer deux modèles?

9

Comment dois-je comprendre le anovarésultat lors de la comparaison de deux modèles?

Exemple:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

La page de manuel indique: "Calculez l'analyse des tables de variance (ou de déviance) pour un ou plusieurs objets de modèle ajustés." Cependant, notre professeur a mentionné qu'il pourrait être utilisé pour la comparaison de modèles - c'est ce que j'ai l'intention de faire.

Par conséquent, je suppose que je pourrais utiliser anova(model1, model2)et obtenir une valeur de p qui me dit si je dois rejeter l'hypothèse nulle: "les modèles sont les mêmes".

Puis-je déclarer que si la valeur de p est inférieure à (disons) 0,05, les modèles diffèrent considérablement?

petrbel
la source
Dans votre exemple, les modèles 1 et 2 sont-ils imbriqués? Autrement dit, les deux modèles ont-ils un ensemble partagé de variables prédictives et la même variable de résultat, mais un modèle a une ou plusieurs variables prédictives supplémentaires?
EdM
L'un est comme Y ~ X + X^2et le secondY ~ X + X^2 + X^3
Petrbel

Réponses:

13

En supposant que vos modèles sont imbriqués (c.-à-d. La même variable de résultat et le modèle 2 contient toutes les variables du modèle 1 plus 2 variables supplémentaires), les résultats de l'ANOVA indiquent que les 2 variables supplémentaires représentent conjointement suffisamment de variance pour que vous puissiez rejeter l'hypothèse nulle selon laquelle la les coefficients des deux variables sont égaux à 0. C'est effectivement ce que vous avez dit. Si les deux coefficients sont égaux à 0, les modèles sont les mêmes.

Model1:y=a+bx1+cx2+dx3;Model2:y=a+bx1+cx2x3car::Anovaanova

le_andrew
la source
Si je vous ai bien compris, la valeur de p inférieure à 0,05 prouve que les modèles diffèrent, serrés?
petrbel
3
Je n'utiliserais pas ces mots (c'est-à-dire "prouver" et "modèles différents"), mais nous voulons dire la même chose. Je dirais que vos données ne supportent pas l'hypothèse nulle que les coefficients sont tous les deux 0 ou que les données supportent l'hypothèse alternative que les coefficients ne sont pas tous les deux 0.
le_andrew
1
Avant d'affirmer que les modèles s'avèrent différents ou que l'hypothèse nulle n'est pas prise en charge, assurez-vous que les données satisfont raisonnablement aux hypothèses de l'ANOVA qui sous-tendent le calcul et l'interprétation des valeurs de p.
EdM
Pour être sûr, la dernière partie sur la somme des carrés de type I ne s'applique qu'à la situation où anova()est utilisé sur un modèle?
Jasper