Probabilités de régression logistique

8

J'ai construit un modèle de régression logistique en R et bien que le résultat semble satisfaisant dans une certaine mesure, il y a une question que je ne suis pas en mesure de répondre. Je ne sais pas si mon approche est correcte.

Je sais que l'objectif global du modèle logistique est de prédire la probabilité de succès d'une variable aléatoire binaire. A partir du même modèle logistique, est-il possible de connaître la probabilité pour une proportion donnée? Supposons par exemple que nous souhaitons déterminer la probabilité d'être admis dans une école et que nous utilisons une régression logistique pour estimer cette probabilité, qui dépendra évidemment de certaines variables indépendantes. Ma question porte sur le même modèle, est-il possible d'estimer la proportion d'élèves qui seront admis dans cette école particulière?

J'ai essayé d'utiliser la probabilité binomiale pour répondre à cela, mais pour une raison quelconque, cela ne me donne pas la bonne réponse. Comment j'y suis allé. Si nous connaissons la probabilité de succès, nous savons également que la variable dépendante suit une distribution binomiale avec les paramètres N et P, où N est le nombre d'essais et P est la probabilité de succès qui peut être estimée à partir du modèle logistique. Donc, si je veux la probabilité que la proportion soit inférieure ou égale à dire p, je pensais que cela équivalait à la probabilité que dans N essais, il y ait un succès N * p inférieur ou égal à la probabilité de succès étant P.

PS Je sais que la probabilité de réussite est un taux / proportion global mais ce qui m'intéresse, c'est de découvrir la probabilité pour un certain groupe. La caractéristique de groupe pourrait être incluse dans le modèle mais cela serait limitant dans mon cas. En fait, je suis plus intéressé à trouver la probabilité d'une proportion à partir du modèle logistique plutôt que le succès d'un certain groupe.

Merci

ThinkStatsme
la source
7
Si j'ai bien compris cette question, elle demande comment utiliser un modèle logistique pour estimer la distribution du nombre d'étudiants admis parmi un bassin spécifique de candidats. Un tel résultat peut être obtenu , mais si vous êtes intéressé à l'appliquer, alors il pourrait être utile de considérer certaines des hypothèses qui pourraient être violées. En particulier, le calcul de ce résultat doit supposer que l'admission d'une personne n'affectera pas les chances d'admission des autres. Si l'école a un quota pour certains types de candidats, ce ne sera pas le cas, par exemple.
whuber
@whuber, Je veux en partie estimer le nombre d'étudiants admis parmi un groupe spécifique de candidats. Il est également plus intéressant, même si je ne l'ai pas formulé correctement, de pouvoir attribuer une probabilité à l'estimation du taux de réussite moyen à partir du modèle logistique. Par exemple, si le succès estimé pour un cas est de 85%, existe-t-il un moyen de déterminer la probabilité que cela puisse être inférieur à 60%? Est-ce que cela a du sens maintenant? J'ai pensé que je pourrais peut-être utiliser l'erreur standard sur la prédiction pour répondre à cela, serait-ce correct?
ThinkStatsme

Réponses:

1

Si je comprends bien votre question, vous avez prédit la probabilité pour chaque individu, mais vous voulez connaître la probabilité moyenne d'un segment de ces individus? Par exemple, vous avez 1000 individus avec un taux moyen de 65% mais seulement 300 ont les yeux bleus, quel est le taux moyen de ceux aux yeux bleus? Ensuite, vous pouvez simplement faire la moyenne de vos probabilités estimées pour ceux aux yeux bleus.

Josh
la source