Comment interpréter une courbe de survie du modèle de risque de Cox?

9

Comment interprétez-vous une courbe de survie à partir du modèle de risque proportionnel cox?

Dans cet exemple de jouet, supposons que nous ayons un modèle de risque proportionnel cox sur agevariable dans les kidneydonnées et générons la courbe de survie.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

entrez la description de l'image ici

Par exemple, au moment 200 , quelle affirmation est vraie? ou les deux ont tort?

  • Énoncé 1: il nous restera 20% de sujets (par exemple, si nous avons 1000 personnes, au jour , nous devrions en avoir environ ), 200200

  • Énoncé 2: pour une personne donnée, elle a chances de survivre au jour .20020%200


Ma tentative: je ne pense pas que les deux déclarations soient les mêmes (corrigez-moi si je me trompe), car nous n'avons pas l'hypothèse iid (le temps de survie pour toutes les personnes n'est PAS tiré d'une distribution indépendamment). C'est similaire à la régression logistique dans ma question ici , le taux de risque de chaque personne dépend de pour cette personne.βTX

Haitao Du
la source
Notez que votre modèle suppose l'indépendance entre les heures des événements.
ocram
l'analyse de survie peut avoir des hypothèses d'indépendance
Aksakal
il semble donc que la question porte vraiment sur le codage R plutôt que sur les statistiques pures. il faut connaître la syntaxe et les caractéristiques des fonctions particulières utilisées dans l'exemple. si tel est le cas, n'est-ce pas hors sujet à certains égards? sinon, vous devez expliquer ce qui se passe à ceux qui n'utilisent pas R
Aksakal

Réponses:

5

Étant donné que l'aléa dépend des covariables, la fonction de survie aussi. Le modèle suppose que la fonction de risque d'un individu de vecteur covariable est h ( t ; x ) = h 0 ( t ) e β x . Par conséquent, le risque cumulatif de cet individu est H ( t ; x ) = t 0 h ( u ; x ) d u = t 0 h 0 (X

h(t;X)=h0(t)eβX.
où nous pouvons définir H 0 ( t ) = t 0 h 0 ( u ) d u comme l'aléa cumulatif de référence. La fonction de survie pour un individu avec le vecteur covariable x est à son tour S ( t ; x ) = e - H ( t ;
H(t;X)=0th(u;X)u=0th0(u)eβXu=H0(t)eβX,
H0(t)=0th0(u)uX où nous définissons S 0 (t)= e - H 0 ( t ) comme fonction de survie de base.
S(t;X)=e-H(t;X)=e-H0eβX=S0(t)eβX
S0(t)=e-H0(t)

β^S^0(t)XS^(t;X)=S^0(t)eβ^X

Le calcul ceci dans R vous spécifiez la valeur de vos covariables dans l' newdataargument. Par exemple, si vous voulez que la fonction de survie pour les individus d'âge = 70, dans R, faites

plot(survfit(fit, newdata=data.frame(age=70)))

newdata?survfit.coxphS0(t)eβX¯

Jarle Tufto
la source
Je suis d'accord avec toi. Ceci est une réponse bien écrite. Je m'excuse auprès de l'OP pour mon erreur et j'apprécie la façon dont l'OP l'a corrigée.
Michael R. Chernick
@ hxd1101 Après avoir lu la page d'aide de survfit.coxphplus attentivement, j'ai corrigé une erreur dans ma réponse, voir mise à jour.
Jarle Tufto
2

Il nous restera 20% de sujets (par exemple, si nous avons 1000 personnes, au jour 200, nous devrions en avoir 200)? ou Pour une personne donnée, elle a 20% de chances de survivre au jour 200?

Dans sa forme la plus pure, la courbe de Kaplan-Meier dans votre exemple ne fait aucune des déclarations ci-dessus.

La première déclaration fait une projection avec impatience aura . La courbe de survie de base ne décrit que le passé, votre échantillon. Oui, 20% de votre échantillon a survécu au jour 200. 20% survivront-ils au cours des 200 prochains jours? Pas nécessairement.

Pour faire cette déclaration, vous devez ajouter plus d'hypothèses, construire un modèle, etc. Le modèle n'a même pas besoin d'être statistique dans un sens comme la régression logistique. Par exemple, il pourrait PDE en épidémiologie, etc.

Votre deuxième affirmation est probablement basée sur une sorte d'hypothèse d'homogénéité: toutes les personnes sont les mêmes.

Aksakal
la source
XβTX
@ hxd1011, cela dépend de votre modèle. Si vous modélisez des pièces automobiles, vous pouvez très bien supposer qu'elles sont identiques. d'autre part leurs échecs pourraient être corrélés par le numéro de lot, alors ils ne sont pas les mêmes etc.
Aksakal
J'ai édité ma question pour être plus précis sur le modèle cox, votre réponse sur la courbe de Kaplan_Meier s'applique-t-elle toujours?
Haitao Du
2

S0(t)S(t)

S0(t)S(t)X=0

Haitao Du
la source
0

S(t)=0,2t

t1-h(t)h(t)

Concernant les hypothèses: je pensais que les tests de coefficient habituels dans un cadre de régression de Cox supposent l'indépendance, conditionnelle aux covariables observées? Même l'estimation de Kaplan-Meier semble exiger l'indépendance entre le temps de survie et la censure ( référence ). Mais je peux me tromper, les corrections sont donc les bienvenues.

juod
la source