J'ai exécuté une courbe de survie de censure d'intervalle avec R, JMP et SAS. Ils m'ont tous deux donné des graphiques identiques, mais les tableaux différaient un peu. Voici le tableau que JMP m'a donné.
Start Time End Time Survival Failure SurvStdErr
. 14.0000 1.0000 0.0000 0.0000
16.0000 21.0000 0.5000 0.5000 0.2485
28.0000 36.0000 0.5000 0.5000 0.2188
40.0000 59.0000 0.2000 0.8000 0.2828
59.0000 91.0000 0.2000 0.8000 0.1340
94.0000 . 0.0000 1.0000 0.0000
Voici le tableau que SAS m'a donné:
Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1 14 16 0.5 0.5 0.5 0.1581
2 21 28 0.0 0.5 0.5 0.1581
3 36 40 0.3 0.8 0.2 0.1265
4 91 94 0.2 1.0 0.0 0.0
R avait une sortie plus petite. Le graphique était identique et le résultat était:
Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2
Mes problèmes sont:
- Je ne comprends pas les différences
- Je ne sais pas comment interpréter les résultats ...
- Je ne comprends pas la logique derrière la méthode.
Si vous pouviez m'aider, en particulier pour l'interprétation, ce serait d'une grande aide. J'ai besoin de résumer les résultats en quelques lignes et je ne sais pas comment lire les tableaux.
Je dois ajouter que l'échantillon ne comportait que 10 observations, malheureusement, d'intervalles dans lesquels les événements se sont produits. Je ne voulais pas utiliser la méthode d'imputation médiane qui est biaisée. Mais j'ai deux intervalles de (2,16], et la première personne à ne pas survivre a échoué à 14 ans dans l'analyse, donc je ne sais pas comment elle fait ce qu'elle fait.
Graphique:
R
etSAS
complètement d'accord les uns avec les autres:SAS
comprend 4 intervalles au lieu de 3, mais notez que le CDF ne change pas dans l'intervalle 2! En fait, lesJMP
résultats sont également d'accord, mais sont un peu plus difficiles à suivre.Réponses:
Le problème le plus important ici est la compréhension de la censure et le type qui s'applique à votre situation. Donc, pour vos problèmes 1. et 3., comprenez le contexte de votre problème. Cela vous aidera à définir la méthode de censure appropriée.
La sortie R indique que le premier groupe d'échecs se situe dans l'intervalle (14,16]. Cela ne signifie pas que l'échec s'est produit à 14. Cela signifie que R a supposé que les données étaient censurées à droite, ce qui est l'hypothèse la plus courante. pour l'analyse de survie. Pourquoi l'échec est-il cité comme une plage (14,16] par opposition à une simple probabilité à 16? C'est probablement dû à une estimation de la limite de confiance.
Interprétation du résultat R, qui est similaire à SAS: La probabilité de défaillance à t = 16 est de 50%, à t = 40 est de 30%, à t = 94 est de 20%.
Oubliez d'essayer de comprendre le problème en utilisant trois packages d'analyse. Choisissez-en un, comprenez les options que vous pouvez définir pour la censure et utilisez-le. Un bon lien pour R: ici
la source