Interprétation de l'intrigue (glm.model)

30

Quelqu'un peut-il me dire comment interpréter les graphiques «résidus vs ajustés», «q-q normal», «emplacement-échelle» et «résidus vs effet de levier»? Je pose un GLM binomial, l'enregistre puis le trace.

Été
la source
4
Savez-vous comment interpréter ces graphes lorsqu'il s'agit d'une régression linéaire régulière? Parce que cela devrait être votre point de départ.
Steve S

Réponses:

55

Rn'a pas de plot.glm()méthode distincte . Lorsque vous ajustezglm() et exécutez un modèle plot(), il appelle ? Plot.lm , qui convient aux modèles linéaires (c'est-à-dire avec un terme d'erreur normalement distribué).

En général, la signification de ces tracés (au moins pour les modèles linéaires) peut être apprise dans divers threads existants sur CV (par exemple: Résidus vs ajustés ; qq-tracés à plusieurs endroits: 1 , 2 , 3 ; Scale-Location ; Residuals vs effet de levier ). Cependant, ces interprétations ne sont généralement pas valables lorsque le modèle en question est une régression logistique.

Plus précisément, les parcelles auront souvent un aspect drôle et amèneront les gens à croire qu'il y a quelque chose qui ne va pas avec le modèle quand il est parfaitement bien. Nous pouvons le voir en regardant ces graphiques avec quelques simulations simples où nous savons que le modèle est correct:

  # we'll need this function to generate the Y data:
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

set.seed(10)                    # this makes the simulation exactly reproducible
x  = runif(20, min=0, max=10)   # the X data are uniformly distributed from 0 to 10
lo = -3 + .7*x                  # this is the true data generating process
p  = lo2p(lo)                   # here I convert the log odds to probabilities
y  = rbinom(20, size=1, prob=p) # this generates the Y data

mod = glm(y~x, family=binomial) # here I fit the model
summary(mod)                    # the model captures the DGP very well & has no
# ...                           #  obvious problems:
# Deviance Residuals: 
#      Min        1Q    Median        3Q       Max  
# -1.76225  -0.85236  -0.05011   0.83786   1.59393  
# 
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)  
# (Intercept)  -2.7370     1.4062  -1.946   0.0516 .
# x             0.6799     0.3261   2.085   0.0371 *
# ...
# 
# Null deviance: 27.726  on 19  degrees of freedom
# Residual deviance: 21.236  on 18  degrees of freedom
# AIC: 25.236
# 
# Number of Fisher Scoring iterations: 4

Voyons maintenant les tracés que nous obtenons plot.lm():

entrez la description de l'image ici

Le graphique Residuals vs Fittedet les Scale-Locationgraphiques semblent avoir des problèmes avec le modèle, mais nous savons qu'il n'y en a pas. Ces graphiques, destinés aux modèles linéaires, sont tout simplement souvent trompeurs lorsqu'ils sont utilisés avec un modèle de régression logistique.

Regardons un autre exemple:

set.seed(10)
x2 = rep(c(1:4), each=40)                    # X is a factor with 4 levels
lo = -3 + .7*x2
p  = lo2p(lo)
y  = rbinom(160, size=1, prob=p)

mod = glm(y~as.factor(x2), family=binomial)
summary(mod)                                 # again, everything looks good:
# ...
# Deviance Residuals: 
#   Min       1Q   Median       3Q      Max  
# -1.0108  -0.8446  -0.3949  -0.2250   2.7162  
# 
# Coefficients:
#                Estimate Std. Error z value Pr(>|z|)    
# (Intercept)      -3.664      1.013  -3.618 0.000297 ***
# as.factor(x2)2    1.151      1.177   0.978 0.328125    
# as.factor(x2)3    2.816      1.070   2.632 0.008481 ** 
# as.factor(x2)4    3.258      1.063   3.065 0.002175 ** 
# ... 
# 
# Null deviance: 160.13  on 159  degrees of freedom
# Residual deviance: 133.37  on 156  degrees of freedom
# AIC: 141.37
# 
# Number of Fisher Scoring iterations: 6

entrez la description de l'image ici

Maintenant, tous les complots semblent étranges.

Alors, que vous montrent ces intrigues?

  • L' Residuals vs Fittedintrigue peut vous aider à voir, par exemple, s'il y a des tendances curvilignes que vous avez manquées. Mais l'ajustement d'une régression logistique est curviligne par nature, vous pouvez donc avoir des tendances étranges dans les résidus sans rien de mal.
  • Le Normal Q-Qtracé vous aide à détecter si vos résidus sont normalement distribués. Mais les résidus de déviance ne doivent pas être normalement distribués pour que le modèle soit valide, donc la normalité / non-normalité des résidus ne vous dit pas nécessairement quoi que ce soit.
  • L' Scale-Locationintrigue peut vous aider à identifier l'hétéroscédasticité. Mais les modèles de régression logistique sont à peu près hétéroscédastiques par nature.
  • Le Residuals vs Leveragepeut vous aider à identifier d'éventuelles valeurs aberrantes. Mais les valeurs aberrantes dans la régression logistique ne se manifestent pas nécessairement de la même manière que dans la régression linéaire, donc ce graphique peut ou non être utile pour les identifier.

La leçon simple à retenir ici est que ces graphiques peuvent être très difficiles à utiliser pour vous aider à comprendre ce qui se passe avec votre modèle de régression logistique. Il est probablement préférable que les gens ne regardent pas du tout ces parcelles lors de la régression logistique, sauf s'ils ont une expertise considérable.

gung - Réintégrer Monica
la source
5
Bon deuil, c'est une réponse incroyable.
d8aninja
@gung Pourriez-vous s'il vous plaît dire que pouvons-nous faire si c'est un glm? Existe-t-il une alternative à QQ, résiduel vs ajusté? Par exemple, j'ai tracé un GLM de lien poisson, mais je ne sais pas comment l'analyser est bon
GRS
2
@GRS, essayez de lire ceci .
gung - Rétablir Monica
@Toutes vos réponses sont détaillées et claires. Outre la lecture de plusieurs sources, y compris ce site, pouvez-vous recommander un ou deux bons livres / sites pour obtenir une «expertise considérable» dans la compréhension des parcelles de diagnostic? Je comprends que peu de compétences que nous pouvons acquérir avec la pratique et l'expérience seulement, mais si un livre / site Web particulier couvrant les détails en profondeur si vous pouvez vous référer, ce serait d'une grande aide.
Dr Nisha Arora
@DrNishaArora, pas vraiment à ma connaissance. Il y a des livres qui sont pertinents pour LR, mais ils ne vont pas passer beaucoup de temps sur ces parcelles, pour les raisons indiquées.
gung - Rétablir Monica
0
  1. Résidus vs ajustés - il ne devrait pas y avoir de modèles forts (les modèles légers ne sont pas un problème, voir la réponse de @ gung) et pas de valeurs aberrantes, les résidus devraient être distribués au hasard autour de zéro.
  2. QQ normal - les résidus devraient faire le tour de la ligne diagonale, c'est-à-dire qu'ils devraient être distribués normalement (voir wiki pour le tracé QQ ). Ce graphique permet de vérifier s'ils sont approximativement normaux.
  3. Emplacement de l'échelle - comme vous pouvez le voir, sur l'axe Y il y a aussi des résidus (comme dans Résidus vs tracé ajusté), mais ils sont mis à l'échelle, donc c'est similaire à (1), mais dans certains cas, cela fonctionne mieux.
  4. Résidus vs effet de levier - il aide à diagnostiquer les cas périphériques. Comme dans les graphiques précédents, les cas périphériques sont numérotés, mais sur ce graphique s'il y a des cas très différents du reste des données, ils sont tracés sous de fines lignes rouges (vérifiez le wiki sur la distance de Cook ).

En savoir plus sur les hypothèses de régression, car à bien des égards, il existe des similitudes (par exemple ici , ou tutoriel sur la régression dans R ici ).

Tim
la source
2
Cette réponse est incorrecte dans le contexte de glm, ainsi que l'expose @gung, dans la réponse ci-dessus. Si vous cherchez une réponse à cette question, IGNOREZ CETTE RÉPONSE. Si vous êtes l'auteur de cette réponse, consultez la réponse ci-dessus par gung. Si vous êtes d'accord, vous devriez envisager de supprimer cette réponse, car elle est trompeuse.
colin
@colin aimeriez-vous commenter ce qui ne va pas exactement à votre avis avec cette réponse? La seule différence entre la mienne et la deuxième réponse est que le gung va dans plus de détails ...
Tim
3
vous décrivez comment ces graphiques doivent être utilisés dans le contexte de la régression linéaire. gung explique pourquoi ces interprétations échouent dans ce cas, car elles sont appliquées à un modèle glm binomial. Donc, si un utilisateur interprète ces tracés de diagnostic comme vous le suggérez (et vos suggestions seraient utiles dans un cas de lm), ils concluront à tort que leur modèle viole les hypothèses de glm, alors qu'en réalité ce n'est pas le cas.
colin
vous écrivez: "Résidus vs ajustés - il ne devrait pas y avoir de régularité ni de valeurs aberrantes, les résidus devraient être distribués au hasard autour de 0." Gung écrit: «L'intrigue Résiduels vs ajustés peut vous aider à voir, par exemple, s'il y a des tendances curvilignes que vous avez manquées. un raté." ... l'un de vous doit avoir tort.
colin
2
Je suis d'accord, ce n'est pas noir et blanc, mais il existe de nombreux cas où il y a de fortes tendances, mais le modèle spécifié est totalement approprié sous les hypothèses de la glm spécifique. Par conséquent, affirmant qu '"il ne devrait y avoir aucun modèle et aucune valeur aberrante, les résidus devraient être distribués au hasard autour de 0". est facilement interprété que s'il y a un modèle, vous avez violé les hypothèses du modèle. Ce n'est pas le cas.
colin