Régression logistique et variables indépendantes ordinales

10

J'ai trouvé ce post:

Oui. Le coefficient reflète le changement des cotes logarithmiques pour chaque incrément de changement dans le prédicteur ordinal. Cette spécification de modèle (très courante) suppose que le prédicteur a un impact linéaire sur ses incréments. Pour tester l'hypothèse, vous pouvez comparer un modèle dans lequel vous utilisez la variable ordinale comme prédicteur unique à un modèle dans lequel vous discrétisez les réponses et les traitez comme des prédicteurs multiples (comme vous le feriez si la variable était nominale); si ce dernier modèle n'aboutit pas à un ajustement significativement meilleur, alors traiter chaque incrément comme ayant un effet linéaire est raisonnable.

- @ dmk38 12 décembre 10 à 5:21

Pourriez-vous s'il vous plaît me dire où trouver quelque chose publié qui soutient cette affirmation? Je travaille avec des données et j'aimerais utiliser des variables indépendantes ordinales dans la régression logistique.

Frederico
la source
Voir une question similaire stats.stackexchange.com/q/195246/3277
ttnphns

Réponses:

2

Comme le note @Scortchi , vous pouvez également utiliser des polynômes orthogonaux. Voici une démonstration rapide dans R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...
gung - Réintégrer Monica
la source
8

Tout bon livre sur la régression logistique aura cela, mais peut-être pas exactement dans ces mots. Essayez l'analyse de données catégorielles d'Agresti pour une source très fiable.

Elle découle également de la définition de la régression logistique (ou d'autres régressions). Il existe peu de méthodes explicites pour les variables indépendantes ordinales . Les options habituelles le traitent comme catégorique (qui perd l'ordre) ou comme continue (ce qui fait l'hypothèse énoncée dans ce que vous avez cité). Si vous le traitez comme continu, le programme qui effectue l'analyse ne sait pas que c'est ordinal. Par exemple, supposez que votre IV est "A quel point aimez-vous le président Obama?" et vos choix de réponse sont une échelle de Likert de 1. «Beaucoup» à 5. «Pas du tout». Si vous traitez ceci comme continu alors (du point de vue du programme) une réponse "5" est 5 fois une réponse "1". Cela peut être déraisonnable ou non.

Peter Flom
la source
3
Section 5.4.6. Et vous pouvez étendre l'idée en utilisant des polynômes orthogonaux pour coder le prédicteur ordinal.
Scortchi - Réintégrer Monica
Merci pour vos commentaires, ils m'aideront beaucoup dans mon analyse.
Frederico
2
@Frederico, si la réponse de Peter a résolu votre question, vous devez l'accepter en cliquant sur la coche sous le total des votes à gauche.
gung - Rétablir Monica