J'ai un modèle logistique GLM avec 8 variables. J'ai effectué un test du chi-carré dans R anova(glm.model,test='Chisq')
et 2 des variables se révèlent être prédictives lorsqu'elles sont ordonnées en haut du test et pas tellement lorsqu'elles sont ordonnées en bas. La summary(glm.model)
donne à penser que leurs coefficients ne sont pas significatifs (p-valeur élevée). Dans ce cas, il semble que les variables ne sont pas significatives.
Je voulais demander quel est le meilleur test de la signification des variables - la signification du coefficient dans le résumé du modèle ou le test du Khi-deux de anova()
. Aussi - quand l'un ou l'autre est-il meilleur que l'autre?
Je suppose que c’est une question générale, mais nous apprécierons tous les indicateurs.
Réponses:
En plus de la réponse de @ gung, je vais essayer de donner un exemple de ce que la
anova
fonction teste réellement. J'espère que cela vous permettra de décider quels tests sont appropriés pour les hypothèses que vous souhaitez tester.my.mod <- glm(y~x1+x2+x3, family="binomial")
anova(my.mod, test="Chisq")
glm(y~1, family="binomial")
contre.glm(y~x1, family="binomial")
glm(y~x1, family="binomial")
contre.glm(y~x1+x2, family="binomial")
glm(y~x1+x2, family="binomial")
contre.glm(y~x1+x2+x3, family="binomial")
Ainsi, il compare séquentiellement le plus petit modèle avec le prochain modèle plus complexe en ajoutant une variable à chaque étape. Chacune de ces comparaisons est effectuée via un test du rapport de vraisemblance (test LR; voir l'exemple ci-dessous). À ma connaissance, ces hypothèses sont rarement intéressantes, mais vous devez en décider.
Voici un exemple dans
R
:summary(my.mod)
x1
:glm(y~x2+x3, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
x2
:glm(y~x1+x3, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
x3
:glm(y~x1+x2, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
Donc, chaque coefficient par rapport au modèle complet contenant tous les coefficients. Les tests de Wald sont une approximation du test du rapport de vraisemblance. Nous pourrions également faire les tests du rapport de vraisemblance (test LR). Voici comment:
lep
summary(my.mod)
rank
anova(my.mod, test="Chisq")
rank
anova(mod1.2, my.mod, test="Chisq")
rank
et le modèle qui le contient.la source
test="Chisq"
vous n'exécutez pas de test du rapport de probabilité, vous devez définirtest="LRT"
pour cela, voir ? Anova.glm .test="LRT"
ettest="Chisq"
sont synonymes (il est dit sur la page que vous avez lié).test="LRT"
est mieux car il est tout de suite clair que c’est un test du rapport de vraisemblance. Je l'ai changé. Merci.7.088e-05, 0.01419, 00.03684
) doivent être interprétées?