Nous travaillons avec quelques régressions logistiques et nous avons réalisé que la probabilité moyenne estimée est toujours égale à la proportion de celles de l'échantillon; c'est-à-dire que la moyenne des valeurs ajustées est égale à la moyenne de l'échantillon.
Quelqu'un peut-il m'expliquer la raison ou me donner une référence où je peux trouver cette démonstration?
Réponses:
Le comportement que vous observez est le cas «typique» de régression logistique, mais n'est pas toujours vrai. Il est également beaucoup plus général (voir ci-dessous). C'est la conséquence de la confluence de trois faits distincts.
Si l'un des éléments ci-dessus n'est pas présent, les probabilités moyennes estimées ne correspondent généralement pas à la proportion de celles de l'échantillon.
Cependant, (presque) tous les logiciels statistiques utilisent l'estimation du maximum de vraisemblance pour de tels modèles, donc, dans la pratique, les éléments 1 et 2 sont essentiellement toujours présents, et l'élément 3 est généralement présent, sauf dans des cas particuliers.
Quelques détails
Dans le cadre de régression logistique typique, nous observons le résultat d'essais binomiaux indépendants avec une probabilité . Soit y i les réponses observées. Alors la vraisemblance totale est L = n ∏ i = 1 p y i i ( 1 - p i ) 1 - y i = n ∏ i = 1 exp ( y i log ( p i / ( 1 - p ipje yje
et donc la log-vraisemblance est
ℓ = n ∑ i = 1 y i log ( p i / ( 1 - p i ) ) + n ∑ i = 1 log ( 1 - p i )
Maintenant, nous avons un vecteur de prédicteurs pour chaque observation et d'après le fait 1 ci-dessus, le modèle de régression logistique postule que log p iXje
Une simulation
Cas général : Comme mentionné ci-dessus, la propriété selon laquelle la réponse moyenne est égale à la moyenne prédite moyenne est beaucoup plus générale pour la classe des modèles linéaires généralisés ajustés par maximum de vraisemblance, en utilisant la fonction de lien canonique et en incluant une interception dans le modèle.
Les références
Quelques bonnes références pour la théorie associée sont les suivantes.
la source