Je sais que les résidus Pearson standardisés sont obtenus de manière probabiliste traditionnelle:
et les résidus de déviance sont obtenus de manière plus statistique (la contribution de chaque point à la vraisemblance):
où = 1 si = 1 et = -1 si = 0.
Pouvez-vous m'expliquer, intuitivement, comment interpréter la formule des résidus de déviance?
De plus, si je veux en choisir un, lequel est le plus adapté et pourquoi?
BTW, certaines références affirment que nous dérivons les résidus de déviance en fonction du terme
où est mentionné ci-dessus.
Réponses:
La régression logistique cherche à maximiser la fonction de vraisemblance logarithmique
où est la probabilité prédite que le cas i soit ; est le nombre de cas observés comme et est le nombre de cas (les autres) observés comme .Pi Y^=1 k Y=1 r Y=0
Cette expression est égale à
parce que la déviance résiduelle d' un cas est définie comme:
Ainsi, la régression logistique binaire cherche directement à minimiser la somme des résidus de déviation au carré. Ce sont les résidus de déviance qui sont impliqués dans l'algorithme ML de la régression.
La statistique du chi carré de l'ajustement du modèle est , où le modèle complet contient des prédicteurs et pas le modèle réduit.2(LLfull model−LLreduced model)
la source