J'ai le résultat suivant en exécutant la fonction glm.
Comment interpréter les valeurs suivantes:
- Déviance nulle
- Déviance résiduelle
- AIC
Ont-ils quelque chose à voir avec la qualité de l'ajustement? Puis-je calculer une mesure de la qualité de l'ajustement à partir de ces résultats, comme le carré R ou toute autre mesure?
Call:
glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 +
as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.52628 -0.24781 -0.02916 0.25581 0.48509
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept -1.305e-01 1.391e-01 -0.938 0.3482
tmpData$X1 -9.999e-01 1.059e-03 -944.580 <2e-16 ***
tmpData$X2 -1.001e+00 1.104e-03 -906.787 <2e-16 ***
tmpData$X3 -5.500e-03 3.220e-03 -1.708 0.0877 .
tmpData$X4 -1.825e-05 2.716e-05 -0.672 0.5017
tmpData$X5 1.000e+00 5.904e-03 169.423 <2e-16 ***
tmpData$X6 1.002e+00 1.452e-03 690.211 <2e-16 ***
tmpData$X7 6.128e-04 3.035e-04 2.019 0.0436 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for gaussian family taken to be 0.08496843)
Null deviance: 109217.71 on 3006 degrees of freedom
Residual deviance: 254.82 on 2999 degrees of freedom
(4970 observations deleted due to missingness)
AIC: 1129.8
Number of Fisher Scoring iterations: 2
r
regression
generalized-linear-model
apprenant
la source
la source
Réponses:
glm
glm
Il y a un débat sur la façon dont une telle mesure sur le LHS est interprétée, mais seulement lorsque les modèles s'écartent de la situation gaussienne / OLS plus simple. Mais dans les GLM où la fonction de lien peut ne pas être "identité", comme c'était le cas ici, et "l'erreur quadratique" peut ne pas avoir la même interprétation claire, donc le critère d'information d'Akaike est également signalé car il semble être plus général. Il y a plusieurs autres prétendants au tirage au sort GLM GOF sans vainqueur clair.
la source
Utilisez la déviation nulle et la déviance résiduelle, en particulier:
Si vous y réfléchissez, vous essayez de mesurer le rapport de la déviance dans votre modèle au zéro; à quel point votre modèle est meilleur (déviance résiduelle) que la simple interception (déviance nulle). Si ce rapport est minuscule, vous «expliquez» la majeure partie de la déviance dans le nul; 1 moins qui vous donne votre R au carré.
Dans votre cas, vous obtiendrez .998.
Si vous appelez simplement le modèle linéaire (lm) au lieu de glm, il vous donnera explicitement un R au carré dans le résumé et vous pouvez voir que c'est le même nombre.
la source
Si vous exécutez un modèle logistique binaire, vous pouvez également exécuter le test d'adéquation Hosmer Lemeshow sur votre modèle glm (). Utilisation de la bibliothèque ResourceSelection.
la source
family = "binomial
. L'exemple de OP est la régression linéaire.hoslem.test()