J'essaie d'ajuster les données avec un GLM (régression de poisson) dans R. Lorsque j'ai tracé les résidus par rapport aux valeurs ajustées, le tracé a créé plusieurs "lignes" (presque linéaires avec une légère courbe concave). Qu'est-ce que ça veut dire?
library(faraway)
modl <- glm(doctorco ~ sex + age + agesq + income + levyplus + freepoor +
freerepa + illness + actdays + hscore + chcond1 + chcond2,
family=poisson, data=dvisits)
plot(modl)
homework
donné que vous parliez d'une mission.table(dvisits$doctorco)
. À quoi correspondent les 10 lignes courbes de votre tracé dans ce tableau? De plus, avec plus de 5000 observations, ne vous inquiétez pas trop de l'ajustement de 13 coefficients de régression.Réponses:
C'est l'apparence que vous attendez d'un tel tracé lorsque la variable dépendante est discrète.
Nous pouvons reproduire assez étroitement le graphique en question au moyen d'un modèle similaire mais arbitraire (utilisant de petits coefficients aléatoires):
la source
Parfois, des rayures comme celles-ci dans les graphiques résiduels représentent des points avec des valeurs observées (presque) identiques qui obtiennent des prédictions différentes. Regardez vos valeurs cibles: combien de valeurs uniques sont-elles? Si ma suggestion est correcte, il devrait y avoir 9 valeurs uniques dans votre ensemble de données d'entraînement.
la source
Ce modèle est caractéristique d'une correspondance incorrecte de la famille et / ou du lien. Si vous avez des données sur-dispersées, alors vous devriez peut-être considérer les distributions binomiales négatives (nombre) ou gamma (continues). Vous devez également tracer vos résidus par rapport au prédicteur linéaire transformé, et non aux prédicteurs lorsque vous utilisez des modèles linéaires généralisés. Pour transformer le prédicteur de Poisson, vous devez prendre 2 fois la racine carrée du prédicteur linéaire et tracer vos résidus par rapport à cela. De plus, les résidus ne devraient pas être exclusivement des résidus de nacre, essayez les résidus de déviance et les résidus étudiés.
la source