Pourquoi les coefficients de régression logistique exponentiels sont-ils considérés comme des «odds ratios»?

10

La régression logistique modélise les cotes logarithmiques d'un événement comme un ensemble de prédicteurs. Autrement dit, log (p / (1-p)) où p est la probabilité d'un certain résultat. Ainsi, l'interprétation des coefficients de régression logistique brute pour une variable (x) doit être sur l'échelle log odds. Autrement dit, si le coefficient pour x = 5, alors nous savons qu'un changement d'une unité dans x correspond à un changement de 5 unités sur l'échelle de cotes logarithmiques qu'un résultat se produira.

Cependant, je vois souvent des gens interpréter les coefficients de régression logistique exponentiels comme des rapports de cotes. Cependant, clairement exp (log (p / (1-p))) = p / (1-p), ce qui est une chance. D'après ce que je comprends, un rapport de cotes est la cote d'un événement se produisant (par exemple, p / (1-p) pour l'événement A) par rapport à la cote d'un autre événement se produisant (par exemple, p / (1-p) pour l'événement B).

Qu'est-ce que j'oublie ici? Il semble que cette interprétation courante des coefficients de régression logistique exponentiels soit incorrecte.

jack
la source

Réponses:

10

À mon avis, la réponse de Laconic est excellente et complète. Quelque chose que je voulais ajouter, c'est que les coefficients d'origine décrivent une différence dans les cotes logarithmiques pour deux unités qui diffèrent de 1 dans le prédicteur. Par exemple, pour un coefficient sur de 5, on peut dire que la différence de cotes logarithmiques entre deux unités qui diffèrent sur de 1 est 5. Mathématiquement,XXX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

Lorsque vous exposez , vous obtenezβ

exp(β)=exp(log(odds(p|X=x0+1))log(odds(p|X=x0)))=exp(log(odds(p|X=x0+1)))exp(log(odds((p|X=x0)))=odds(p|X=x0+1)odds(p|X=x0))

qui est un rapport de cotes, un rapport de cotes.

Noé
la source
2
C'est extrêmement clair pour moi. Ma question est résolue.
jack
10

Considérons deux ensembles de conditions, la première décrite par le vecteur de variables indépendantes , et la seconde décrite par le vecteur , qui ne diffère que par la ième variable , et par une unité. Soit le vecteur des paramètres du modèle comme d'habitude.X x i βXXxiβ

Selon le modèle de régression logistique, la probabilité que l'événement se produise dans le premier cas est , de sorte que la probabilité que l'événement se produise est . p1p1=11+exp(Xβ)p11p1=exp(Xβ)

La probabilité que l'événement se produise dans le deuxième cas est , de sorte que la probabilité que l'événement se produise est . p2p2=11+exp(Xβ)p21p2=exp(Xβ)=exp(Xβ+βi)

Le rapport des cotes dans le second cas aux cotes dans le premier cas est donc . D'où l'interprétation de l'exponentielle du paramètre comme un rapport de cotes.exp(βi)

Le laconique
la source