Diagnostic pour la régression logistique?

74

Pour la régression linéaire, nous pouvons vérifier les tracés de diagnostic (tracés de résidus, tracés QQ normaux, etc.) pour vérifier si les hypothèses de régression linéaire sont violées.

Pour la régression logistique, j'ai du mal à trouver des ressources qui expliquent comment diagnostiquer l'ajustement du modèle de régression logistique. En fouillant quelques notes de cours pour GLM, cela indique simplement que la vérification des résidus n’est pas utile pour effectuer le diagnostic pour un ajustement de régression logistique.

En regardant sur Internet, il semble également exister diverses procédures de "diagnostic", telles que la vérification de la déviance du modèle et la réalisation de tests du khi-deux, mais d'autres sources affirment que cela est inapproprié et que vous devez effectuer un test d'ajustement Hosmer-Lemeshow. tester. Ensuite, je trouve d’autres sources indiquant que ce test peut être fortement dépendant des regroupements réels et des valeurs seuils (peut ne pas être fiable).

Alors, comment diagnostiquer la régression logistique?

ialm
la source
1
Possibilité de dupliquer (ou cas particulier) de stats.stackexchange.com/questions/29271/… ou de stats.stackexchange.com/questions/44643/… , même si aucun d’entre eux n’a de solution pour le résoudre réellement.
Peter Ellis
1
Je vous recommande de lire la monographie de Scott Menard, qui, il n'y a pas si longtemps, était disponible gratuitement dans son intégralité sur Internet.
rolando2
2
Cette question sur les mesures d'ajustement pour la régression logistique peut être utile (bien que l'ajustement ne soit bien sûr qu'une petite partie des diagnostics de modèle): stats.stackexchange.com/questions/3559/registic-regression-which-pseudo-r- carré-mesure-est-le-celui-à-rapport-cox / 3570
S. Kolassa - Réintégrer Monica

Réponses:

39

Quelques techniques plus récentes que j'ai rencontrées pour évaluer l'adéquation des modèles de régression logistique proviennent de revues de sciences politiques:

  • Greenhill, Brian, Michael D. Ward et Audrey Sacks. 2011. Le tracé de séparation: une nouvelle méthode visuelle d'évaluation de l'ajustement des modèles binaires. Journal américain de science politique 55 (4): 991-1002 .
  • Esarey, Justin et Andrew Pierce. 2012. Évaluer la qualité de l'ajustement et tester les erreurs de spécification dans les modèles de variables dépendantes binaires. Analyse politique 20 (4): 480-500 . Preprint PDF ici

Ces deux techniques prétendent remplacer les tests de qualité d'adaptation (comme Hosmer et Lemeshow) et identifier une éventuelle spécification erronée (en particulier la non-linéarité dans les variables incluses dans l'équation). Celles-ci sont particulièrement utiles car les mesures d’ajustement R-carré typiques sont fréquemment critiquées .

Les deux articles ci-dessus utilisent les probabilités prédites par rapport aux résultats observés dans les graphiques - évitant quelque peu la question peu claire de ce qui est un résidu dans de tels modèles. Des exemples de résidus pourraient être la contribution à la log-vraisemblance ou les résidus de Pearson (je crois qu’il en existe beaucoup plus). Une autre mesure souvent intéressante (bien que non résiduelle) est la DFBeta (le montant estimé par un coefficient change lorsqu'une observation est exclue du modèle). Voir les exemples dans Stata pour cette page UCLA sur les diagnostics de régression logistique ainsi que sur d'autres procédures de diagnostic potentielles.

Je ne l’ai pas sous la main, mais je crois que les modèles de régression de J. Scott Long pour les variables dépendantes catégorielles et limitées fournissent suffisamment de détails sur toutes ces différentes mesures de diagnostic de manière simple.

Andy W
la source
2
Il existe de nombreux autres livres sur la régression logistique (au moins en partie, sinon dans leur intégralité). Scott Menard, Hosmer and Lemeshow, et le livre RMS de Frank Harrell, d'Agresti, sont tous ceux que j'ai vus recommandés sur ce forum par divers contributeurs.
Andy W
Merci pour votre réponse. Je suppose qu'il n'y a pas de réponse simple à ma question. Je vais examiner vos recommandations. À votre santé.
ialm
23

La question n'était pas assez motivée. Il doit y avoir une raison d’exécuter des diagnostics de modèle, tels que

  • Potentiel de changer le modèle pour le rendre meilleur
  • Ne sachant pas quels tests dirigés utiliser (par exemple, des tests de non-linéarité ou d'interaction)
  • P

À l'exception de la vérification d'éléments orthogonaux à la spécification de régression algébrique (par exemple, l'examen de la distribution des résidus dans des modèles linéaires ordinaires), le diagnostic de modèle peut créer autant de problèmes qu'ils résolvent, à mon avis. Cela est particulièrement vrai du modèle logistique binaire, car il ne repose sur aucune hypothèse de répartition.

Il est donc généralement préférable de passer du temps à spécifier le modèle, en particulier pour ne pas supposer de linéarité pour les variables considérées comme fortes pour lesquelles aucune preuve antérieure ne suggère de linéarité. Dans certaines occasions , vous pouvez pré-définir un modèle qui doit s'adapter, par exemple, si le nombre de prédicteurs est faible ou vous permettre à tous les facteurs prédictifs d'être non linéaire et (correctement) supposent aucune interaction.

Toute personne estimant que les diagnostics de modèle peuvent être utilisés pour modifier le modèle doit exécuter ce processus au sein d'une boucle d'amorçage pour estimer correctement les incertitudes du modèle induit.

Frank Harrell
la source
4
Je conviens que les diagnostics de modèle devraient découler de l'objectif de la modélisation. Cependant, votre paragraphe d'ouverture m'a donné l'impression que nous ne devrions pas vérifier les modèles que nous ajustons aux données. Je suis à peu près sûr que ce n'est pas ce que vous aviez en tête. De plus, le modèle logistique binaire certainement n'ont des hypothèses distributifs! (le plus évident étant qu'il n'y a que deux valeurs pour la réponse)
probabilité,
3
Hormis l'hypothèse qu'il n'y a que 2 valeurs possibles spécifiques pour Y, le modèle logistique binaire n'a pas de dist. hypothèses. Personnellement, je n’utilise pas très souvent les diagrammes de diagnostic avec régression logistique, mais plutôt la spécification de modèles suffisamment souples pour adapter les données de la manière que la taille de l’échantillon nous offre le luxe d’examiner. Dans OLS, le tracé de diagnostic principal que j'utilise est le tracé de qq pour la normalité des résidus.
Frank Harrell
Dans une perspective de modèle linéaire généralisé, le modèle logistique découle de la distribution binomiale (distribution de Bernoulli). Mais même dans ce cas, il est difficile d'interpréter les résidus.
New_to_this
Parler de distributions lorsque la variable aléatoire ne peut prendre que deux valeurs (c.-à-d. Distribution de Bernoulli) n’est pas utile car il n’ya aucun moyen que l’hypothèse de distribution puisse se tromper si les observations ne sont pas indépendantes.
Frank Harrell
1
@ FrankHarrell Je me rends compte que vous savez de quoi vous parlez ici, mais je ne pense pas que votre post / vos commentaires montreront clairement que la spécification erronée du prédicteur linéaire (ou même du prédicteur additif dans une Cadre GAM) peut causer des problèmes de régression logistique. Beaucoup pourraient ne pas comprendre que cela crée une non-indépendance dans les données, comme vous le dites. Lorsque les élèves rencontrent une régression linéaire pour la première fois, ils apprennent à inspecter les résidus sans faire de distinction entre la spécification erronée du prédicteur linéaire et la spécification erronée de la distribution des erreurs.
Jacob Socolar
5

Ce fil est assez ancien, mais j’ai pensé qu’il serait utile d’ajouter que, depuis récemment, vous pouvez utiliser le paquet DHARMa R pour transformer les résidus de n’importe quel GL (M) M en un espace normalisé. Une fois que cela est fait, vous pouvez évaluer / tester visuellement les problèmes résiduels tels que les écarts par rapport à la distribution, la dépendance résiduelle à un prédicteur, l'hétéroscédasticité ou l'autocorrélation de manière normale. Voir la vignette du paquet pour des exemples élaborés, ainsi que d'autres questions sur le CV ici et ici .

Florian Hartig
la source