J'ai effectué une régression linéaire de l'acceptation à l'université par rapport aux scores SAT et à l'origine familiale / ethnique. Les données sont fictives. Il s'agit d'un suivi d'une question précédente, déjà répondu. La question se concentre sur la collecte et l'interprétation des rapports de cotes lorsque l'on laisse les scores SAT de côté pour plus de simplicité.
Les variables sont Accepted
(0 ou 1) et Background
("rouge" ou "bleu"). J'ai configuré les données pour que les personnes de fond "rouge" soient plus susceptibles d'entrer:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))
Odds_Ratio_RedvBlue 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
Des questions:
Est-ce que 0,7 est le rapport impair d'une personne de fond "bleu" acceptée? Je pose cette question car j'obtiens également 0,7 pour "
Backgroundblue
" si à la place j'exécute le code suivant:fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit)))
r
regression
logistic
Antoni Parellada
la source
la source
R
qui appelle explicitement les coefficients (via la fonctioncoef
), vous appelez le "rapport de cotes" dans votre sortie. Cela suggère que vous voudrez peut-être revoir la distinction entre les deux.Réponses:
J'ai travaillé pour répondre à ma question en calculant manuellement les cotes et les rapports de cotes:
Donc, le rapport de cotes pour entrer dans l'école de Red over Blue est:
Et c'est le
Backgroundred
retour de:En même temps, le112 / 158 = 0,7089 .
(Intercept)
correspond au numérateur du rapport de cotes , qui est exactement la chance de se retrouver dans un milieu familial «bleu»:Si à la place, je lance:
Les retours sont précisément les chances d'être «bleu»:
Backgroundblue
(0,7089) et les chances d'être accepté «rouge»:Backgroundred
(1,7353). Pas de rapport de cotes là-bas. Par conséquent, les deux valeurs de retour ne devraient pas être réciproques.Enfin, comment lire les résultats s'il y a 3 facteurs dans le régresseur catégorique?
Même calcul manuel que [R]:
J'ai créé un ensemble de données fictives différent avec la même prémisse, mais cette fois il y avait trois origines ethniques: "rouge", "bleu" et "orange", et j'ai exécuté la même séquence:
Tout d'abord, le tableau de contingence:
Et calculé les chances d'entrer pour chaque groupe ethnique:
Ainsi que les différents rapports de cotes :
Et a procédé à la régression logistique désormais systématique suivie d'une exponentiation des coefficients:
Donner les chances d'entrer pour des "bleus" comme le
(Intercept)
, et les rapports de cotes d'Orange contre Bleu dansBackgroundorange
, et le OU de Rouge contre Bleu dansBackgroundred
.D'un autre côté, la régression sans interception n'a renvoyé, comme on pouvait le prévoir, que les trois cotes indépendantes :
la source