Les courbes de Kaplan-Meier semblent dire autre chose que la régression de Cox

9

Dans R, je fais l'analyse des données de survie des patients cancéreux.

J'ai lu des informations très utiles sur l'analyse de survie dans CrossValidated et dans d'autres endroits et je pense avoir compris comment interpréter les résultats de la régression de Cox. Cependant, un résultat me dérange toujours ...

Je compare la survie au sexe. Les courbes de Kaplan-Meier sont clairement en faveur des patientes (j'ai vérifié plusieurs fois que la légende que j'ai ajoutée est correcte, la patiente avec la survie maximale, 4856 jours, est bien une femme): entrez la description de l'image ici

Et la régression de Cox revient:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

Le Hazards Ratio (HR) pour les patients masculins ( gendermale) est donc de 0,6903. La façon dont j'interpréterais cela (sans regarder la courbe de Kaplan-Meier) est la suivante: comme la FC est <1, être un patient de sexe masculin est protecteur. Ou plus précisément, une patiente est 1 / 0,6903 = exp (-coef) = 1,449 plus susceptible de mourir à un moment précis qu'un homme.

Mais cela ne ressemble pas à ce que disent les courbes de Kaplan-Meier! Quel est le problème avec mon interprétation?

francoiskroll
la source
3
D'après votre courbe KM, il semble que l'hypothèse PH de régression de Cox ne soit pas vérifiée.
Deep North
Je vois. Je n'ai jamais examiné cela avant! Graphiquement, cela signifie que mes courbes Kaplan-Meier doivent être parallèles afin que je puisse utiliser Cox en toute sécurité, non? Cela semble plus ou moins correct avant ~ 2200 jours. Est-il correct de regarder les résultats de Cox pour toutes les données un peu avant l'intersection?
francoiskroll
4
NB Ce sont les courbes , où est la fonction de survie estimée pour le groupe , qui devrait être parallèle en cas de risques proportionnels. Comme le souligne @IWS, les intervalles de confiance seront très larges pour le groupe féminin après environ 3000 jours (y en a-t-il seulement deux qui dépassent ce point?), Donc l'hypothèse de PH n'est peut-être pas trop mauvaise. S i ( t ) iloglogS^i(t)S^i(t)i
Scortchi - Réintégrer Monica
@DeepNorth: Je ne vois pas vraiment de preuves solides contre les risques proportionnels. Oui, les courbes se chevauchent techniquement ... mais c'est à l'extrême.
Cliff AB
Pour compléter les autres réponses et commentaires, comparer la survie médiane ou la survie à cinq ans pour les hommes et pour les femmes. Il y a un avantage évident pour les hommes dans ces données en accord avec l'analyse Cox PH.
Itamar

Réponses:

12

Il s'agit d'un très bon exemple de risques non proportionnels OU de l'effet de «déplétion» dans l'analyse de survie. Je vais essayer d'expliquer.

Regardez d'abord votre courbe de Kaplan-Meier (KM): vous pouvez voir dans la première partie (jusqu'à environ 3000 jours) la proportion de mâles encore en vie dans la population à risque au temps t est supérieure à la proportion de femelles (c'est-à-dire que la ligne bleue est «plus haute» que la ligne rouge). Cela signifie en effet que le sexe masculin est «protecteur» pour l'événement (décès) étudié. Par conséquent, le rapport de risque doit être compris entre 0 et 1 (et le coefficient doit être négatif).

Cependant, après 3000 jours, la ligne rouge est plus haute! Cela suggérerait en effet le contraire. Sur la base de ce seul graphique KM, cela suggérerait en outre un danger non proportionnel. Dans ce cas, «non proportionnel» signifie que l'effet de votre variable indépendante (sexe) n'est pas constant dans le temps. En d'autres termes, le rapport de risque est viable pour changer au fil du temps. Comme expliqué ci-dessus, cela semble être le cas. Le modèle Cox à risque proportionnel régulier ne tient pas compte de ces effets. En fait, l'une des principales hypothèses est que les dangers sont proportionnels! Maintenant, vous pouvez également modéliser des risques non proportionnels, mais cela dépasse le cadre de cette réponse.

Il y a un autre commentaire à faire: cette différence pourrait être due au fait que les vrais dangers sont non proportionnels oule fait qu'il y a beaucoup de variance dans les estimations de queue des courbes KM. Il est à noter qu'à ce stade, le groupe total de 348 patients aura diminué pour devenir une très petite population encore à risque. Comme vous pouvez le voir, les deux groupes de sexe ont des patients qui vivent l'événement et des patients censurés (les lignes verticales). À mesure que la population à risque diminue, les estimations de survie deviendront moins certaines. Si vous aviez tracé des intervalles de confiance à 95% autour des lignes KM, vous verriez la largeur de l'intervalle de confiance augmenter. Ceci est également important pour l'estimation des dangers. En termes simples, comme la population à risque et le nombre d'événements dans la dernière période de votre étude sont faibles, cette période contribuera moins aux estimations de votre modèle cox initial.

Enfin, cela expliquerait pourquoi le danger (supposé constant dans le temps) correspond davantage à la première partie de votre KM qu'au lieu du point final.

EDIT: voir le commentaire de @ Scrotchi sur la question initiale: Comme indiqué, l'effet des faibles nombres dans la dernière période de l'étude est que les estimations des dangers à ces moments sont incertaines. Par conséquent, vous êtes également moins certain que la violation apparente de l'hypothèse des risques proportionnels ne soit pas due au hasard. Comme le dit @ scrotchi, l'hypothèse de PH n'est peut-être pas si mauvaise.

IWS
la source
1
(-1) Les queues se croisent aux extrémités extrêmes, où nous avons extrêmement peu de données. En fait, les preuves de «risques non proportionnels» sont basées sur seulement deux observations (c.-à-d. Lorsque t> 2800, il ne restait que deux sujets dans la cohorte féminine, et en plus de cela, le dernier événement avant celui du groupe était d'environ t = 2100)
Cliff AB
2
@CliffAB Merci pour les commentaires Cliff AB. Je suis cependant un peu confus, car votre remarque est exactement ce que j'essayais de dire. J'avoue: ça aurait pu être un peu plus court. Le -1 est un peu dur cependant: '(
IWS
2
c'était peut-être un peu méchant de ma part. Mon seul point est que lorsque je regarde cela, je ne vois pas nécessairement un bon exemple de risques non proportionnels, mais plutôt peu de données sur les queues. Je vois que la première phrase a été révisée (je pense que si je ne l'ai pas manquée la première fois?) Pour répondre, alors maintenant le (-1) est définitivement inutile.
Cliff AB
1
Oups, il semble que je l'ai manqué la première fois. Désolé!
Cliff AB
Pas de problème, au moins nous nous mettons d'accord sur la réponse: D
IWS
5

Vous êtes confus quant à la nature de votre sortie. Ces données indiquent: Si vous êtes un homme, vous êtes plus susceptible de vivre plus longtemps qu'une femme; Les femmes ont une survie pire que les hommes. Cela se reflète dans le résultat de la régression, car le fait d'être MALE a pour effet d'avoir un log ratio de risque négatif, par exemple, les hommes ont un risque plus faible que les femmes. A la plupart des événements (lorsque les courbes "marchent"), la courbe de survie des mâles est supérieure à celle des femelles, les résultats du modèle de Cox et le graphique s'accordent très bien. Les courbes KM le confirment, tout comme la sortie du modèle de régression. La "croix" est sans importance.

Les courbes KM se comportent mal dans les queues, surtout lorsqu'elles approchent de 0% et / ou s'effilent à plat. L'axe des Y est la proportion qui survit. Avec relativement peu de personnes qui survivent longtemps dans l'étude et peu de personnes qui meurent à ce moment-là, la fiabilité des estimations est terriblement intuitive et graphique. Je note, par exemple, qu'il y a visiblement moins de femmes dans votre cohorte que d'hommes et qu'après 2800 jours, il reste moins de 10 femmes dans la cohorte, comme en témoignent les étapes de la courbe de survie et le manque d'événements censurés.

Remarque intéressante, étant donné que les analyses de survie utilisant des courbes KM, les tests de log-rank et les modèles de Cox utilisent le temps de survie classé , la durée réelle de survie est quelque peu hors de propos. Votre plus longue femelle survivante aurait pu, en fait, survivre encore 100 ans et cela n'aurait aucun impact sur les analyses. En effet, la fonction de risque de base (n'ayant observé aucun événement au cours des 13 dernières années) supposerait qu'il n'y avait aucun risque de décès pour les 87 prochaines années puisque personne n'est décédé à ce moment-là.

Si vous voulez une HR robuste pour obtenir des IC et des valeurs de p corrects à 95% pour cela, spécifiez robust=TRUEdans le Cox-PH pour obtenir des erreurs standard en sandwich. Dans ce cas, la FC est une FC à moyenne temporelle comparant les hommes aux femmes à tous les moments d'échec.

AdamO
la source
Pour clarifier: dans la parcelle KM, les mâles ont une meilleure survie jusqu'à environ 2700 jours. Après cela, les femmes ont une meilleure survie. Mais cette queue n'est pas précise car il y a si peu de données. Vous pouvez voir que deux étapes de la courbe KM font passer la survie des femmes d'environ 35% à 0%, ce qui est probablement deux personnes.Il serait utile de tracer les courbes KM avec des bandes de confiance. Ensuite, je suppose que vous verriez une séparation claire jusqu'à environ 2000 jours, puis se chevaucheraient ensuite.
Harvey Motulsky
2
@HarveyMotulsky true mais la queue des KM n'est pas très fiable. Si OP tirait les IC, ils se chevaucheraient fortement, de sorte que, par déduction, nous dirions que la survie était probablement équivoque après 2700 jours.
AdamO
Exactement mon point. Les données montrent clairement que les hommes (dans cette situation, quelle qu'elle soit) ont une meilleure survie au moins pendant les 2000 premiers jours ou plus.
Harvey Motulsky