La régression logistique modélise les cotes logarithmiques d'un événement comme un ensemble de prédicteurs. Autrement dit, log (p / (1-p)) où p est la probabilité d'un certain résultat. Ainsi, l'interprétation des coefficients de régression logistique brute pour une variable (x) doit être sur l'échelle log odds. Autrement dit, si le coefficient pour x = 5, alors nous savons qu'un changement d'une unité dans x correspond à un changement de 5 unités sur l'échelle de cotes logarithmiques qu'un résultat se produira.
Cependant, je vois souvent des gens interpréter les coefficients de régression logistique exponentiels comme des rapports de cotes. Cependant, clairement exp (log (p / (1-p))) = p / (1-p), ce qui est une chance. D'après ce que je comprends, un rapport de cotes est la cote d'un événement se produisant (par exemple, p / (1-p) pour l'événement A) par rapport à la cote d'un autre événement se produisant (par exemple, p / (1-p) pour l'événement B).
Qu'est-ce que j'oublie ici? Il semble que cette interprétation courante des coefficients de régression logistique exponentiels soit incorrecte.
la source
Considérons deux ensembles de conditions, la première décrite par le vecteur de variables indépendantes , et la seconde décrite par le vecteur , qui ne diffère que par la ième variable , et par une unité. Soit le vecteur des paramètres du modèle comme d'habitude.X ′ x i βX X′ Xje β
Selon le modèle de régression logistique, la probabilité que l'événement se produise dans le premier cas est , de sorte que la probabilité que l'événement se produise est . p1p1= 11 + exp( -Xβ) p11 - p1=exp(Xβ)
La probabilité que l'événement se produise dans le deuxième cas est , de sorte que la probabilité que l'événement se produise est . p2p2= 11 + exp( - X′β) p21 - p2= exp( X′β) = exp( Xβ+ βje)
Le rapport des cotes dans le second cas aux cotes dans le premier cas est donc . D'où l'interprétation de l'exponentielle du paramètre comme un rapport de cotes.exp(βi)
la source