Y a-t-il une différence fonctionnelle entre un rapport de cotes et un rapport de risque?

10

Dans la régression logistique, un rapport de cotes de 2 signifie que l'événement est 2 fois plus probable compte tenu d'une augmentation d'une unité du prédicteur. Dans la régression de Cox, un rapport de risque de 2 signifie que l'événement se produira deux fois plus souvent à chaque instant, compte tenu d'une augmentation d'une unité du prédicteur. N'est-ce pas pratiquement la même chose?

Quel est alors l’avantage de faire une régression de Cox et d’obtenir des ratios de risque si nous pouvons obtenir fonctionnellement les mêmes informations à partir des rapports de cotes de la régression logistique?

ATJ
la source

Réponses:

12

un rapport de cotes de 2 signifie que l'événement est 2 fois plus probable compte tenu d'une augmentation d'une unité du prédicteur

Cela signifie que les chances doubleraient, ce qui n'est pas la même chose que la probabilité de doubler.

Dans la régression de Cox, un rapport de risque de 2 signifie que l'événement se produira deux fois plus souvent à chaque instant, compte tenu d'une augmentation d'une unité du prédicteur.

Mis à part un peu de handwaving, oui - le taux d'occurrence double. C'est comme une probabilité instantanée à l'échelle.

N'est-ce pas pratiquement la même chose?

C'est presque la même chose lorsque doubler les chances de l'événement équivaut presque à doubler le risque de l'événement. Ils ne sont pas automatiquement similaires, mais dans certaines circonstances (assez courantes), ils peuvent correspondre très étroitement.

Vous voudrez peut-être examiner plus attentivement la différence entre les cotes et les probabilités.

Voir, par exemple, la première phrase ici , qui indique clairement que les probabilités sont le rapport d'une probabilité à son complément. Ainsi, par exemple, augmenter la cote (en faveur) de 1 à 2 équivaut à augmenter la probabilité de à . Les chances augmentent plus vite que les probabilités. Pour les très faibles probabilités, les cotes en faveur et les probabilités sont très similaires, tandis que les cotes contre deviennent de plus en plus similaires (dans le sens où le ratio ira à 1) inverses de probabilité à mesure que la probabilité diminue. Un rapport de cotes est simplement le rapport de deux ensembles de cotes. L'augmentation du rapport de cotes tout en maintenant une cote de base constante correspond à une augmentation des autres cotes, mais peut ou non être similaire au changement relatif de probabilité.1223

Vous voudrez peut-être également réfléchir à la différence entre le danger et la probabilité (voir ma discussion précédente où je mentionne le fait de faire signe de la main; maintenant, nous ne masquons pas la différence). Par exemple, si une probabilité est de 0,6, vous ne pouvez pas la doubler - mais un risque instantané de 0,6 peut être doublé à 1,2. Ce n'est pas la même chose, de la même manière que la densité de probabilité n'est pas une probabilité.

Glen_b -Reinstate Monica
la source
2
+1 Il suffit de commenter pour mentionner que certaines formes d'analyse de l'historique des événements utilisent une définition différente de la fonction de risque (par exemple, dans les modèles d'historique d'événements à temps discret est la probabilité qu'un événement se produise au moment condition qu'il ne se soit pas produit avant ce moment, et en tant que tel n'aurait aucun sens dans de tels modèles). t 2 × 0,6h(t)t2×0.6
Alexis
1
Merci, c'est vraiment pertinent. Ceci est lié au fait qu'un pmf discret ne peut pas dépasser 1 alors qu'une densité peut certainement.
Glen_b -Reinstate Monica
3

C'est une bonne question. Mais ce que vous demandez vraiment ne devrait pas être comment la statistique est interprétée mais quelles hypothèses sous-tendent chacun de vos modèles respectifs (aléa ou logistique). Un modèle logistique est un modèle statique qui prédit efficacement la probabilité qu'un événement se produise à un moment donné compte tenu des informations observables. Cependant, un modèle de risque ou modèle de Cox est un modèle de durée qui modélise les taux de survie dans le temps. Vous pourriez poser une question du type "quelle est la probabilité qu'un utilisateur de cigarettes survive jusqu'à 75 ans par rapport à un non-utilisateur avec votre régression logistique" (étant donné que vous avez des informations sur la mortalité d'une cohorte jusqu'à 75 ans) . Mais si, au contraire, vous souhaitez profiter de l'intégralité de la dimension temporelle de vos données, l'utilisation d'un modèle de risque sera plus appropriée.

En fin de compte, cela dépend vraiment de ce que vous voulez modéliser. Croyez-vous que ce que vous modélisez est un événement ponctuel? Utilisez la logistique. Si vous pensez que votre événement a une chance fixe ou proportionnelle de se produire à chaque période sur un spectre temporel observable? Utilisez un modèle de danger.

Le choix des méthodes ne doit pas être basé sur la façon dont vous interprétez la statistique. Si tel était le cas, il n'y aurait aucune différence entre OLS, LAD, Tobit, Heckit, IV, 2SLS ou une foule d'autres méthodes de régression. Il devrait plutôt être basé sur la forme que vous croyez prendre le modèle sous-jacent que vous essayez d'estimer.

Francis Smart
la source
-1 (Mixte) Les modèles logistiques peuvent certainement modéliser les taux de survie dans le temps. Voir par exemple Allison, PD (1982). Méthodes à temps discret pour l'analyse des historiques d'événements . Sociological Methodology , 13 (1982), 61–98, ou Allison, PD (1984). Analyse de l'historique des événements: régression pour les données d'événements longitudinaux (vol. 12). Sage Beverly Hills, Californie.
Alexis