Censure d'intervalle

J'ai exécuté une courbe de survie de censure d'intervalle avec R, JMP et SAS. Ils m'ont tous deux donné des graphiques identiques, mais les tableaux différaient un peu. Voici le tableau que JMP m'a donné.

Start Time  End Time    Survival    Failure SurvStdErr
.            14.0000      1.0000     0.0000     0.0000
16.0000      21.0000      0.5000     0.5000     0.2485
28.0000      36.0000      0.5000     0.5000     0.2188
40.0000      59.0000      0.2000     0.8000     0.2828
59.0000      91.0000      0.2000     0.8000     0.1340
94.0000     .             0.0000     1.0000     0.0000

Voici le tableau que SAS m'a donné:

Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1    14    16      0.5          0.5             0.5        0.1581
2    21    28      0.0          0.5             0.5        0.1581
3    36    40      0.3          0.8             0.2        0.1265
4    91    94      0.2          1.0             0.0        0.0

R avait une sortie plus petite. Le graphique était identique et le résultat était:

Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2

Mes problèmes sont:

Je ne comprends pas les différences
Je ne sais pas comment interpréter les résultats ...
Je ne comprends pas la logique derrière la méthode.

Si vous pouviez m'aider, en particulier pour l'interprétation, ce serait d'une grande aide. J'ai besoin de résumer les résultats en quelques lignes et je ne sais pas comment lire les tableaux.

Je dois ajouter que l'échantillon ne comportait que 10 observations, malheureusement, d'intervalles dans lesquels les événements se sont produits. Je ne voulais pas utiliser la méthode d'imputation médiane qui est biaisée. Mais j'ai deux intervalles de (2,16], et la première personne à ne pas survivre a échoué à 14 ans dans l'analyse, donc je ne sais pas comment elle fait ce qu'elle fait.

Graphique:

entrez la description de l'image ici

r survival sas jmp interval-censoring user45442
la source

En fait, Ret SAScomplètement d'accord les uns avec les autres: SAScomprend 4 intervalles au lieu de 3, mais notez que le CDF ne change pas dans l'intervalle 2! En fait, les JMPrésultats sont également d'accord, mais sont un peu plus difficiles à suivre.

Cliff AB

Réponses:

Le problème le plus important ici est la compréhension de la censure et le type qui s'applique à votre situation. Donc, pour vos problèmes 1. et 3., comprenez le contexte de votre problème. Cela vous aidera à définir la méthode de censure appropriée.

La sortie R indique que le premier groupe d'échecs se situe dans l'intervalle (14,16]. Cela ne signifie pas que l'échec s'est produit à 14. Cela signifie que R a supposé que les données étaient censurées à droite, ce qui est l'hypothèse la plus courante. pour l'analyse de survie. Pourquoi l'échec est-il cité comme une plage (14,16] par opposition à une simple probabilité à 16? C'est probablement dû à une estimation de la limite de confiance.

Interprétation du résultat R, qui est similaire à SAS: La probabilité de défaillance à t = 16 est de 50%, à t = 40 est de 30%, à t = 94 est de 20%.

Oubliez d'essayer de comprendre le problème en utilisant trois packages d'analyse. Choisissez-en un, comprenez les options que vous pouvez définir pour la censure et utilisez-le. Un bon lien pour R: ici

Gary Chung
la source

Le contexte de la question est une rechute d'une condition. Je m'intéresse au moment de la rechute. Malheureusement, les visites de suivi ne sont pas quotidiennes, et donc si lors de la visite numéro 4 la rechute s'est produite, je ne sais pas où entre 3 (+ un jour) et 4 c'est arrivé. La censure est une censure à droite, et parmi 10 observations, une seule a été censurée (94, infini). Serait-il exact de dire que 50% ont survécu plus de 28 jours?

user45442

et une autre question, puisque la censure des intervalles est basée sur des données inconnues, quelle est l’efficacité de l’estimation basée sur 10 observations? Les estimations sont-elles vraiment meilleures que celles que j'obtiendrais de la manière biaisée d'imputation médiane, dans laquelle je prends la moyenne de chaque intervalle pour représenter l'intervalle?

user45442

Je ne dirais pas que 50% ont survécu 28 jours ou plus, car vous ne le savez pas pour la raison même de l'incertitude pendant l'intervalle que vous avez indiqué. Vous pouvez dire que 50% ont survécu jusqu'au jour 16. En ce qui concerne la question de l'intervalle, vous soulevez un problème très réel lié à l'imprécision des données. L'utilisation d'une méthode d'imputation à mi-parcours est logique, mais l'approche largement acceptée pour votre situation est l' estimation de Kaplan Meier .

Gary Chung

@GaryChung: vous ignorez complètement l' aspect de censure d' intervalle de ces données.

Cliff AB