Interprétation des prédicteurs transformés par log dans la régression logistique

15

L'un des prédicteurs de mon modèle logistique a été la transformation logarithmique. Comment interprétez-vous le coefficient estimé du prédicteur transformé en logarithme et comment calculez-vous l'impact de ce prédicteur sur le rapport de cotes?


la source
1
Un traitement très clair et complet de cette question est la réponse de jthetzel
rolando2
Merci pour votre aide. Une précision supplémentaire. En fait, si je me transforme en base logarithmique 2, alors selon la réponse précédente, il est intuitivement logique qu'un doublement du prédicteur entraîne un changement de% du résultat.
mp77

Réponses:

16

Si vous exponentiate le coefficient estimé, vous obtiendrez un odds ratio associé à un -fold augmenterb dans le prédicteur, où est la base du logarithme utilisé lors de log-transformation du facteur prédictif.b

Je choisis généralement de prendre des logarithmes à la base 2 dans cette situation, afin que je puisse interpréter le coefficient exponentiellement comme un rapport de cotes associé à un doublement du prédicteur.

un arrêt
la source
3
Intéressant. J'utilise toujours des logarithmes naturels car de nombreux coefficients ont tendance à être proches de zéro et peuvent alors être interprétés comme des différences proportionnelles (relatives). Ce n'est possible dans aucune autre base de logarithme. Je vois un certain mérite à utiliser d'autres bases, mais je pense que vous devez clarifier votre réponse, car à première vue votre interprétation n'utilise pas du tout la valeur du coefficient!
whuber
@whuber désolé que signifie prima facie ? Première face ??
2011
8

@gung est tout à fait correct, mais, au cas où vous ne décidez de le garder, vous pouvez interpréter le coefficient a avoir un effet sur chaque multiple de la IV, plutôt que chaque ajout de la IV.

Un IV qui devrait souvent être transformé est le revenu. Si vous l'incluiez non transformé, chaque augmentation de revenu (par exemple) de 1 000 $ aurait un effet sur le rapport de cotes spécifié par le rapport de cotes. D'un autre côté, si vous preniez log (10) du revenu, alors chaque augmentation de 10 fois du revenu aurait un effet sur le rapport de cotes spécifié dans le rapport de cotes.

Il est logique de le faire pour le revenu, car, à bien des égards, une augmentation de 1 000 $ du revenu est beaucoup plus importante pour quelqu'un qui gagne 10 000 $ par an que quelqu'un qui gagne 100 000 $ .

Une dernière remarque - bien que la régression logistique ne fasse aucune hypothèse de normalité, même la régression OLS ne fait pas d'hypothèses sur les variables, elle fait des hypothèses sur l'erreur, comme estimé par les résidus.

Peter Flom - Réintégrer Monica
la source
1
+1, bons points. Je suppose que j'aurais pu être plus complet. De plus, j'ai désactivé le mathjax par inadvertance en mettant une barre oblique inverse "\" juste avant les signes du dollar. J'espère que ça ne vous dérange pas.
gung - Rétablir Monica
Qu'entendez-vous par «la régression logistique fait l'hypothèse des erreurs»?
Non, la régression OLS fait des hypothèses sur les erreurs. Voilà ce que j'ai dit.
Peter Flom - Réintègre Monica
3

Cette réponse est adaptée de The Statistical Sleuth de Fred L. Ramsey et Daniel W. Schafer.

Si votre équation de modèle est:

log(p/(1p))=β0+βlog(X)

kXkβ

Par exemple, j'ai le modèle suivant pour la présence d'escarres régressées sur la durée du séjour à l'hôpital.

log(oddsofbedsore)=.44+0.45(lengthofstay)

β=0.45

k

k=2

kβ=20.45=1.37

k=2

k=0.5

kβ=0.50.45=0.73

k=0.5

LindsayL
la source