un rapport de cotes de 2 signifie que l'événement est 2 fois plus probable compte tenu d'une augmentation d'une unité du prédicteur
Cela signifie que les chances doubleraient, ce qui n'est pas la même chose que la probabilité de doubler.
Dans la régression de Cox, un rapport de risque de 2 signifie que l'événement se produira deux fois plus souvent à chaque instant, compte tenu d'une augmentation d'une unité du prédicteur.
Mis à part un peu de handwaving, oui - le taux d'occurrence double. C'est comme une probabilité instantanée à l'échelle.
N'est-ce pas pratiquement la même chose?
C'est presque la même chose lorsque doubler les chances de l'événement équivaut presque à doubler le risque de l'événement. Ils ne sont pas automatiquement similaires, mais dans certaines circonstances (assez courantes), ils peuvent correspondre très étroitement.
Vous voudrez peut-être examiner plus attentivement la différence entre les cotes et les probabilités.
Voir, par exemple, la première phrase ici , qui indique clairement que les probabilités sont le rapport d'une probabilité à son complément. Ainsi, par exemple, augmenter la cote (en faveur) de 1 à 2 équivaut à augmenter la probabilité de à . Les chances augmentent plus vite que les probabilités. Pour les très faibles probabilités, les cotes en faveur et les probabilités sont très similaires, tandis que les cotes contre deviennent de plus en plus similaires (dans le sens où le ratio ira à 1) inverses de probabilité à mesure que la probabilité diminue. Un rapport de cotes est simplement le rapport de deux ensembles de cotes. L'augmentation du rapport de cotes tout en maintenant une cote de base constante correspond à une augmentation des autres cotes, mais peut ou non être similaire au changement relatif de probabilité.1223
Vous voudrez peut-être également réfléchir à la différence entre le danger et la probabilité (voir ma discussion précédente où je mentionne le fait de faire signe de la main; maintenant, nous ne masquons pas la différence). Par exemple, si une probabilité est de 0,6, vous ne pouvez pas la doubler - mais un risque instantané de 0,6 peut être doublé à 1,2. Ce n'est pas la même chose, de la même manière que la densité de probabilité n'est pas une probabilité.
C'est une bonne question. Mais ce que vous demandez vraiment ne devrait pas être comment la statistique est interprétée mais quelles hypothèses sous-tendent chacun de vos modèles respectifs (aléa ou logistique). Un modèle logistique est un modèle statique qui prédit efficacement la probabilité qu'un événement se produise à un moment donné compte tenu des informations observables. Cependant, un modèle de risque ou modèle de Cox est un modèle de durée qui modélise les taux de survie dans le temps. Vous pourriez poser une question du type "quelle est la probabilité qu'un utilisateur de cigarettes survive jusqu'à 75 ans par rapport à un non-utilisateur avec votre régression logistique" (étant donné que vous avez des informations sur la mortalité d'une cohorte jusqu'à 75 ans) . Mais si, au contraire, vous souhaitez profiter de l'intégralité de la dimension temporelle de vos données, l'utilisation d'un modèle de risque sera plus appropriée.
En fin de compte, cela dépend vraiment de ce que vous voulez modéliser. Croyez-vous que ce que vous modélisez est un événement ponctuel? Utilisez la logistique. Si vous pensez que votre événement a une chance fixe ou proportionnelle de se produire à chaque période sur un spectre temporel observable? Utilisez un modèle de danger.
Le choix des méthodes ne doit pas être basé sur la façon dont vous interprétez la statistique. Si tel était le cas, il n'y aurait aucune différence entre OLS, LAD, Tobit, Heckit, IV, 2SLS ou une foule d'autres méthodes de régression. Il devrait plutôt être basé sur la forme que vous croyez prendre le modèle sous-jacent que vous essayez d'estimer.
la source