Comment interprétez-vous une courbe de survie à partir du modèle de risque proportionnel cox?
Dans cet exemple de jouet, supposons que nous ayons un modèle de risque proportionnel cox sur age
variable dans les kidney
données et générons la courbe de survie.
library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()
Par exemple, au moment , quelle affirmation est vraie? ou les deux ont tort?
Énoncé 1: il nous restera 20% de sujets (par exemple, si nous avons personnes, au jour , nous devrions en avoir environ ),
Énoncé 2: pour une personne donnée, elle a chances de survivre au jour .200
Ma tentative: je ne pense pas que les deux déclarations soient les mêmes (corrigez-moi si je me trompe), car nous n'avons pas l'hypothèse iid (le temps de survie pour toutes les personnes n'est PAS tiré d'une distribution indépendamment). C'est similaire à la régression logistique dans ma question ici , le taux de risque de chaque personne dépend de pour cette personne.
la source
Réponses:
Étant donné que l'aléa dépend des covariables, la fonction de survie aussi. Le modèle suppose que la fonction de risque d'un individu de vecteur covariable est h ( t ; x ) = h 0 ( t ) e β ′ x . Par conséquent, le risque cumulatif de cet individu est H ( t ; x ) = ∫ t 0 h ( u ; x ) d u = ∫ t 0 h 0 (X
Le calcul ceci dans R vous spécifiez la valeur de vos covariables dans l'
newdata
argument. Par exemple, si vous voulez que la fonction de survie pour les individus d'âge = 70, dans R, faitesnewdata
?survfit.coxph
la source
survfit.coxph
plus attentivement, j'ai corrigé une erreur dans ma réponse, voir mise à jour.Dans sa forme la plus pure, la courbe de Kaplan-Meier dans votre exemple ne fait aucune des déclarations ci-dessus.
La première déclaration fait une projection avec impatience aura . La courbe de survie de base ne décrit que le passé, votre échantillon. Oui, 20% de votre échantillon a survécu au jour 200. 20% survivront-ils au cours des 200 prochains jours? Pas nécessairement.
Pour faire cette déclaration, vous devez ajouter plus d'hypothèses, construire un modèle, etc. Le modèle n'a même pas besoin d'être statistique dans un sens comme la régression logistique. Par exemple, il pourrait PDE en épidémiologie, etc.
Votre deuxième affirmation est probablement basée sur une sorte d'hypothèse d'homogénéité: toutes les personnes sont les mêmes.
la source
la source
Concernant les hypothèses: je pensais que les tests de coefficient habituels dans un cadre de régression de Cox supposent l'indépendance, conditionnelle aux covariables observées? Même l'estimation de Kaplan-Meier semble exiger l'indépendance entre le temps de survie et la censure ( référence ). Mais je peux me tromper, les corrections sont donc les bienvenues.
la source