J'ai exécuté cette régression logistique ordinale dans R:
mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)
J'ai obtenu ce résumé du modèle:
summary(mtcars_ordinal)
Re-fitting to get Hessian
Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)
Coefficients:
Value Std. Error t value
mpg -0.2335 0.06855 -3.406
Intercepts:
Value Std. Error t value
1|2 -6.4706 1.6443 -3.9352
2|3 -4.4158 1.3634 -3.2388
3|4 -3.8508 1.3087 -2.9425
4|6 -1.2829 1.3254 -0.9679
6|8 -0.5544 1.5018 -0.3692
Residual Deviance: 81.36633
AIC: 93.36633
Je peux obtenir les cotes logarithmiques du coefficient mpg
comme ceci:
exp(coef(mtcars_ordinal))
mpg
0.7917679
Et les cotes du journal des seuils comme:
exp(mtcars_ordinal$zeta)
1|2 2|3 3|4 4|6 6|8
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353
Quelqu'un pourrait-il me dire si mon interprétation de ce modèle est correcte:
À
mpg
mesure que la valeur augmente d'une unité, les chances de passer de la catégorie 1carb
à l'une des 5 autres catégories diminuent de -0,23. Si la cote du journal dépasse le seuil de 0,0015, la valeur prévue pour une voiture sera de catégorie 2carb
. Si la cote du journal dépasse le seuil de 0,0121, la valeur prédite pour une voiture sera de catégorie 3carb
, et ainsi de suite.
mpg
polr
définit le modèlelogit P(Y <= k | x) = zeta_k - eta
, si l'interprétation de @ StasK ne se lisait pas, "à mesure que lesmpg
augmentations d'une unité, les chances d'observer la catégorie 1 decarb
vs 5 autres catégories augmentent de 26% (exp(-(-0.2335)) = 1.26
)."Dans le modèle logit ordonné, les cotes forment le rapport entre la probabilité d'être dans une catégorie inférieure à un seuil spécifique et la probabilité d'être dans une catégorie supérieure au même seuil (par exemple, avec trois catégories: probabilité d'être dans la catégorie A ou B vs C, ainsi que la probabilité d'être dans la catégorie A vs B ou C).
Cela conduit au modèle
logit P(Y <= k | x) = zeta_k - eta
tel que spécifié dans la description depolr()
. Par conséquent, les rapports de cotes peuvent être créés pour différentes catégories ou pour différents régresseurs. Ce dernier, le plus courant, compare les cotes pour les mêmes catégories mais des régresseurs différents et est égalLe rapport de cotes pour différentes catégories est défini comme
où le rapport est indépendant des régresseurs. Cette propriété conduit à l'autre modèle de cotes proportionnelles de nom .
Dans cet exemple simple, mais peut-être pas très intuitif, vous pourriez formuler: Pour une augmentation d'une unité dans le régresseur
mpg
, les chances d'observer la catégorie 1 vs d'observer toute catégorie supérieure (ou les chances d'observer n'importe quelle catégorie en dessous d'un certain seuil vs. observant toute catégorie au-dessus du même seuil) sont multipliés par 1,26 ou augmentés de 26% (exp(-(-0.233 - 0)) = 1.263
). Si vous souhaitez formuler un rapport de cotes de différentes catégories, vous pouvez, par exemple, dire que les chances d'être dans la catégorie 1 par rapport à n'importe quelle catégorie ci-dessus par rapport aux chances d'être en catégorie 1 ou 2 par rapport à toute catégorie ci-dessus sont égales àexp((-6.470) - (-4.415)) = 0.128
. Cette dernière interprétation n'est donc pas très utile dans cette configuration spécifique. Un exemple d'un rapport de cotes pour différentes catégories pourrait être les chances d'aller au collège par rapport aux chances d'aller au lycée.la source