Aidez-moi à comprendre le rapport de cotes ajusté dans la régression logistique

Les cotes sont un moyen d'exprimer des chances. Les rapports de cotes ne sont que cela: une cote divisée par une autre. Cela signifie qu'un rapport de cotes est ce que vous multipliez par une cote pour en produire une autre. Voyons comment ils fonctionnent dans cette situation courante.

Conversion entre les cotes et les probabilités

Les chances d'une réponse binaire sont le rapport de la chance qu'elle se produit (codé avec ), écrit , à la chance qu'elle ne le fait pas (codé avec ), écrit : $Y$ $1$ $\Pr(Y=1)$ $0$ $\Pr(Y=0)$

Odds (Y) = \frac{Pr (Y = 1)}{Pr (Y = 0)} = \frac{Pr (Y = 1)}{1 - Pr (Y = 1)} .

$\text{Odds}(Y) = \frac{\Pr(Y=1)}{\Pr(Y=0)} = \frac{\Pr(Y=1)}{1 - \Pr(Y=1)}.$

L'expression équivalente à droite montre qu'il suffit de modéliser pour trouver les cotes. Inversement, notons que nous pouvons résoudre $\Pr(Y=1)$

Pr (Y = 1) = \frac{Odds (Y)}{1 + Odds (Y)} = 1 - \frac{1}{1 + Odds (Y)} .

$\Pr(Y=1) = \frac{\text{Odds}(Y)}{1 + \text{Odds}(Y)} = 1 - \frac{1}{1 + \text{Odds}(Y)}.$

Régression logistique

La régression logistique modélise le logarithme des probabilités de en fonction linéaire des variables explicatives. Plus généralement, en écrivant ces variables sous la forme , et en incluant un éventuel terme constant dans la fonction linéaire, nous pouvons nommer les coefficients (qui doivent être estimés à partir des données) comme et . Formellement, cela produit le modèle $Y$ $x_1, \ldots, x_p$ $\beta_1,\ldots, \beta_p$ $\beta_0$

\log (Odds (Y)) = β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p} .

$\log\left(\text{Odds}(Y)\right) = \beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p.$

Les chances elles-mêmes peuvent être récupérées en annulant le logarithme:

Odds (Y) = \exp (β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p}) .

$\text{Odds}(Y) = \exp(\beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p).$

Utilisation de variables catégorielles

Les variables catégorielles, telles que le groupe d'âge, le sexe, la présence de glaucome, etc. , sont incorporées au moyen d'un «codage fictif». Pour montrer que la façon dont la variable est codée n'a pas d'importance, je vais fournir un exemple simple d'un petit groupe; sa généralisation à plusieurs groupes devrait être évidente. Dans cette étude, une variable est la «taille de la pupille», avec trois catégories, «Large», «Medium» et «Small». (L'étude les traite comme purement catégoriques, ne prêtant apparemment aucune attention à leur ordre inhérent.) Intuitivement, chaque catégorie a ses propres cotes, par exemple pour "Large", pour "Medium" et pour "Small" . Cela signifie que, toutes choses égales par ailleurs, $\alpha_L$ $\alpha_M$ $\alpha_S$

Odds (Y) = \exp (α_{L} + β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p})

$\text{Odds}(Y) = \exp(\color{Blue}{\alpha_L + \beta_0} + \beta_1 x_1 + \cdots + \beta_p x_p)$

pour toute personne de la catégorie "Large",

Odds (Y) = \exp (α_{M} + β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p})

$\text{Odds}(Y) = \exp(\color{Blue}{\alpha_M + \beta_0} + \beta_1 x_1 + \cdots + \beta_p x_p)$

pour toute personne de la catégorie "Medium", et

Odds (Y) = \exp (α_{S} + β_{0} + β_{1} x_{1} + \dots + β_{p} x_{p})

$\text{Odds}(Y) = \exp(\color{Blue}{\alpha_S + \beta_0} + \beta_1 x_1 + \cdots + \beta_p x_p)$

pour ceux de la catégorie "Petit".

Création de coefficients identifiables

J'ai coloré les deux premiers coefficients pour les mettre en évidence, car je veux que vous remarquiez qu'ils permettent un changement simple: nous pourrions choisir n'importe quel nombre et, en l'ajoutant à et en le soustrayant de chacun de , et , nous ne modifierions aucune cote prédite. C'est à cause des équivalences évidentes de la forme $\gamma$ $\beta_0$ $\alpha_L$ $\alpha_M$ $\alpha_S$

α_{L} + β_{0} = (α_{L} - γ) + (γ + β_{0}),

$\alpha_L + \beta_0 = (\alpha_L - \gamma) + (\gamma + \beta_0 ),$

etc. Bien que cela ne pose aucun problème pour le modèle - il prédit toujours exactement les mêmes choses - cela montre que les paramètres ne sont pas en eux-mêmes interprétables. Ce qui reste le même lorsque nous effectuons cette manœuvre d'addition-soustraction, ce sont les différences entre les coefficients. Classiquement, pour remédier à ce manque d'identifiabilité, les personnes (et par défaut, les logiciels) choisissent l'une des catégories de chaque variable comme «base» ou «référence» et stipulent simplement que son coefficient sera nul. Cela supprime l'ambiguïté.

Le document énumère d'abord les catégories de référence; "Large" dans ce cas. Ainsi, est soustraite de chacune des et , et ajouté à la à compenser. $\alpha_L$ $\alpha_L, \alpha_M,$ $\alpha_S$ $\beta_0$

La cote logarithmique pour un individu hypothétique entrant dans toutes les catégories de base est donc égale à plus un ensemble de termes associés à toutes les autres «covariables» - les variables non catégorielles: $\beta_0$

Odds(Base category) = \exp (β_{0} + β_{1} X_{1} + \dots + β_{p} X_{p}) .

$\text{Odds(Base category)} = \exp(\beta_0 + \beta_1X_1 + \cdots + \beta_p X_p).$

Aucun terme associé à des variables catégorielles n'apparaît ici. (J'ai légèrement changé la notation à ce stade: les bêtas ne sont maintenant que les coefficients des covariables , tandis que le modèle complet inclut les alphas pour les différentes catégories.) $\beta_i$ $\alpha_j$

Comparer les cotes

Comparons les cotes. Supposons qu'un individu hypothétique soit un

patient de 80 à 89 ans avec une cataracte blanche, pas de vue de fond, et une petite pupille opérée par un registraire spécialisé, ...

$\alpha_\text{80-89}$ $\alpha_\text{male}$

α_{80-89} + α_{male} + α_{no Glaucoma} + \dots + α_{specialist registrar} .

$\alpha_\text{80-89}+\alpha_\text{male}+\alpha_\text{no Glaucoma}+ \cdots + \alpha_\text{specialist registrar}.$

Il s'agit précisément de la différence entre les cotes logarithmiques de ce patient et la base. Pour convertir à partir des cotes du journal, annulez le logarithme et rappelez-vous que cela transforme l'addition en multiplication. Par conséquent, la cote de base doit être multipliée par

\exp (α_{80-89}) \exp (α_{male}) \exp (α_{no Glaucoma}) \dots \exp (α_{specialist registrar}) .

$\exp(\alpha_\text{80-89})\exp(\alpha_\text{male})\exp(\alpha_\text{no Glaucoma}) \cdots \exp(\alpha_\text{specialist registrar}).$

$x_1, \ldots, x_p$ $\exp(\alpha_\text{80-89})=1.58$ $\exp(\alpha_\text{male})=1.28$ $\exp(\alpha_\text{no Glaucoma})=1.00$ , etc. Selon l'article, leur produit fonctionne pour $34.5$ . Donc

Cotes (Charlie) = 34,5 \times Cotes (Base) .

$\text{Odds(Charlie)} = 34.5\times \text{Odds(Base)}.$

(Notez que les catégories de base ont toutes des rapports de cotes de $1.00=\exp(0)$ , car y compris $1$ dans le produit le laisse inchangé. C'est ainsi que vous pouvez repérer les catégories de base dans le tableau.)

Retraiter les résultats en probabilités

Enfin, convertissons ce résultat en probabilités. On nous a dit que la probabilité prédite de base est $0.736\%=0.00736$ . Par conséquent, en utilisant les formules reliant les cotes et les probabilités dérivées au départ, nous pouvons calculer

Cotes (Base) = \frac{0,00736}{1 - 0,00736} = 0,00741.

$\text{Odds(Base)} = \frac{0.00736}{1 - 0.00736} = 0.00741.$

Par conséquent, les chances de Charlie sont

Cotes (Charlie) = 34,5 \times 0,00741 = 0,256.

$\text{Odds(Charlie)} = 34.5\times 0.00741 = 0.256.$

Enfin, la conversion de ce retour en probabilités donne

Pr (Oui (Charlie) = 1) = 1 - \frac{1}{1 + 0,256} = 0,204.

$\Pr(Y(\text{Charlie})=1) = 1 - \frac{1}{1 + 0.256} = 0.204.$

whuber
la source

whuber: se placer devant mon ordinateur après une journée très fatigante et trouver cette réponse extraordinaire de votre part est tout simplement génial. Vous m'avez beaucoup aidé dans une situation très difficile. Merci beaucoup. (en quelque sorte @ whuber ne se présentera pas ...)

mahonya