Analyse de survie: temps continu vs temps discret

20

Je ne sais pas trop comment décider de traiter le temps comme continu ou discret dans l'analyse de survie. Plus précisément, je veux utiliser l'analyse de survie pour identifier les variables au niveau de l'enfant et du ménage qui ont le plus grand écart dans leur impact sur la survie des garçons par rapport aux filles (jusqu'à l'âge de 5 ans). J'ai un ensemble de données sur l'âge des enfants (en mois) avec un indicateur pour savoir si l'enfant est vivant, l'âge au décès (en mois) et d'autres variables au niveau de l'enfant et du ménage.

Étant donné que le temps est enregistré en mois et que tous les enfants ont moins de 5 ans, il existe de nombreux temps de survie liés (souvent à intervalles de six mois: 0mos, 6mos, 12mos, etc.). Sur la base de ce que j'ai lu sur l'analyse de survie, le fait d'avoir de nombreux temps de survie liés me fait penser que je devrais considérer le temps comme discret. Cependant, j'ai lu plusieurs autres études où le temps de survie est, par exemple, les années-personnes (et donc il y a sûrement des temps de survie liés) et des méthodes en temps continu comme les risques proportionnels de Cox sont utilisés.

Quels critères dois-je utiliser pour décider s'il faut traiter le temps comme continu ou discret? Pour mes données et ma question, l'utilisation d'un modèle à temps continu (Cox, Weibull, etc.) a un sens intuitif pour moi, mais la nature discrète de mes données et la quantité de temps de survie liés semblent suggérer le contraire.

smm
la source

Réponses:

10

Le choix du modèle de survie doit être guidé par le phénomène sous-jacent. Dans ce cas, il semble être continu, même si les données sont collectées de manière quelque peu discrète. Une résolution d'un mois serait très bien sur une période de 5 ans. Cependant, le grand nombre de liens à 6 et 12 mois fait que l'on se demande si vous avez vraiment une précision d'un mois (les liens à 0 sont attendus - c'est une valeur spéciale où relativement beaucoup de décès se produisent réellement). Je ne sais pas trop ce que vous pouvez faire à ce sujet, car cela reflète probablement l'arrondi après-coup plutôt que la censure des intervalles.

Aniko
la source
2
En règle générale, si les données discrètes peuvent être divisées en dix parties ou plus, elles peuvent être traitées comme continues, même si elles sont vraiment discrètes (l'échantillonnage une fois par mois pendant six mois est très différent de l'échantillonnage hebdomadaire pendant six mois ou une fois par mois pendant deux ans). L'article suivant donne également quelques informations supplémentaires sur le traitement des données discrètes comme continues: theanalysisfactor.com/count-data-considered-continuous
Tavrock
4

Je soupçonne que si vous utilisez des modèles de temps continu, vous voudrez utiliser la censure d'intervalle, reflétant le fait que vous ne connaissez pas l'heure exacte de l'échec, juste un intervalle dans lequel l'échec s'est produit. Si vous ajustez des modèles de régression paramétrique avec une censure d'intervalle en utilisant la méthode maximale, les temps de survie liés ne sont pas un problème IIRC.

Dikran Marsupial
la source
4

Il y aura des temps de survie liés dans la plupart des analyses, mais de gros morceaux de liens clairs lors d'événements particuliers sont troublants. Je réfléchirais longuement et sérieusement à l'étude elle-même, à la manière dont elle collecte des données, etc.

Parce que, en dehors de certains besoins méthodologiques d'utiliser un type ou un autre de temps, la façon dont vous modélisez la survie devrait dépendre du fait que le processus sous-jacent est discret ou continu dans le monde.

Fomite
la source
1

Si vous avez des covariables qui varient dans le temps pour certaines personnes (par exemple, le revenu familial peut varier dans votre exemple au cours de la vie d'un enfant), les modèles de survie (paramétrique et modèle cox) vous obligent à découper les données en intervalles discrets définis par les covariables variables.

J'ai trouvé ce pdf de notes de cours de l'allemand Rodriguez utile.

sumtxt
la source