Analyse de survie en R avec données tronquées à gauche

8

Je fais une analyse de survie en R avec le survivalpackage. Je pense que je travaille avec des données tronquées à gauche, mais je ne sais pas exactement comment les gérer.

J'ai une cohorte de patients diagnostiqués entre 1990 et 2012. Tous les patients ont une heure de diagnostic bien définie (heure d'entrée). Cependant, le résultat d'intérêt (aggravation spécifique de la maladie) n'a été documenté qu'à partir de l'an 2000 et au-delà. Pour les patients diagnostiqués avant 2000, on ne sait donc pas si le résultat s'est produit avant cette date - seulement après.

Ma première pensée a été que je devais limiter l'analyse à la période de 2000, en n'incluant que les patients diagnostiqués après ce moment. Après avoir fait quelques lectures, il semble inutile d'exclure les patients diagnostiqués avant 2000. Cela semble être de la troncature gauche et qui peut être traité en coxphutilisant Surv(time1, time2, event), où time1 est le temps de troncature gauche (temps entre le diagnostic et le début de la documentation de le résultat) et le temps 2 est le temps de l'événement (à partir du moment du diagnostic).

Voici deux exemples de patients dans mon jeu de données:

Patient n ° 1: diagnostiqué en 1999. Résultat observé en 2001. Temps de troncature gauche: 1 an (jusqu'en 2000). Durée de l'événement: 2 ans.

Patient n ° 2: diagnostiqué en 2001. Résultat observé en 2005. Temps de troncature gauche: 0 ans. Durée de l'événement: 4 ans.

Pour ces patients, je suppose que leurs temps de survie (en années) dans l'objet de survie seraient (respectivement):

Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))

Est-ce un exemple de données tronquées à gauche? Si oui, est-ce la bonne façon de le gérer?

user3766836
la source

Réponses:

3

Je suppose que le temps écoulé depuis le diagnostic est votre variable temporelle sous-jacente. Par souci de simplicité, je suppose également que l'événement ne peut se produire qu'une seule fois.

Vous pouvez traiter vos données comme étant censurées à gauche. Cependant, c'est différent d'être tronqué à gauche.

Pour les données tronquées à gauche, nous incluons uniquement dans l'étude les patients conditionnels à ce qu'ils n'aient pas vécu l'événement au moment de l'inclusion. Dans votre cas, cela reviendrait à jeter les patients qui ont eu l'événement avant 2000. Ainsi, nous modélisons la survie conditionnelle à la survie jusqu'à l'inclusion.

C'est différent de la censure de gauche. La censure à gauche se produit lorsque nous ne connaissons que la limite supérieure du temps d'un événement. C'est exactement ce que vous vous proposez, si je vous comprends bien. Dans ce cas, nous incluons tous les individus quel que soit leur temps de survie, mais pour certains individus nous ne connaissons qu'une limite supérieure de leur temps de survie.

Le chapitre III des modèles statistiques basés sur les processus de comptage par PK Andersen et al. fournit une bonne explication de ce qui précède ainsi que quelques exemples des deux cas.

swmo
la source
2

Vous risquez de vous heurter à un biais de temps immortel , ce qui signifie que la cohorte diagnostiquée avant 2000 est effectivement immortelle, jusqu'à après 2000, lorsque le résultat peut se produire. Pour Rothman et le Groenland, la bonne approche consiste en effet à exclure (tronquer) de l'analyse les années antérieures à 2000, ou bien à biaiser le risque entre les estimations de cohorte vers l'hypothèse nulle de pas de différence de risque.

La survivalcommande Survne semble pas suivre la syntaxe que vous utilisez. Qu'en est-il de la création d'une nouvelle variable où la valeur 0 correspond au début du temps (d'étude) (par exemple année = 2000?), 1 correspond à 1 unité de temps, etc.?

Vous voudrez lire sur: Rothman, KJ et Greenland, S. (1998). Épidémiologie moderne , chapitre Études de cohorte - Immortal Person Time. Lippincott-Raven, 2e édition.

Alexis
la source
Je vois que le biais de temps immortel est important, par exemple, dans les essais de médicaments où les patients recevant le médicament sont garantis de vivre un temps donné par la conception de l'étude alors que le groupe témoin ne l'est pas, ce qui entraîne un effet positif (faux) observé du médicament. Cependant, dans mon cas, l'absence de données sur les résultats est la même pour tous les patients, quelle que soit l'exposition. L'omission de tous les patients diagnostiqués avant 2000 entraînera un grave manque de puissance statistique, car beaucoup d'entre eux connaîtront le résultat après 2000. Je pense qu'il doit y avoir un moyen de contrôler les biais possibles sans omettre ces patients.
user3766836
Ah je vois, ce n'était pas clair. D'un autre côté: peut-être que vos données ne prennent tout simplement pas en charge l'analyse que vous souhaitez effectuer.
Alexis