La variable X (danger) dans l'analyse de régression proportionnelle au danger de Cox doit-elle toujours être temporelle? Sinon, pourriez-vous donner un exemple, s'il vous plaît?
L'âge du patient atteint de cancer peut-il être une variable de risque? Si oui, peut-il être interprété comme le risque de développer un cancer à un certain âge? La régression de Cox serait-elle une analyse légitime pour étudier l'association entre l'expression des gènes et l'âge?
Habituellement, l'âge au départ est utilisé comme covariable (car il est souvent associé à la maladie / décès), mais il peut également être utilisé comme échelle de temps (je pense qu'il est utilisé dans certaines études longitudinales, car vous devez en avoir assez personnes à risque le long de l'échelle de temps, mais je ne me souviens pas réellement - je viens de trouver ces diapositives sur l' analyse des études de cohorte en supposant une échelle de temps continue qui parle des études de cohorte). Dans l'interprétation, vous devez remplacer la durée de l'événement par l'âge, et vous pouvez inclure l'âge au diagnostic comme covariable. Cela aurait du sens lorsque vous étudiez la mortalité par âge d'une maladie particulière (comme illustré dans ces diapositives ).
@chi: Merci beaucoup. Je vais regarder les papiers. Pourriez-vous commenter la première question? Le danger est-il toujours variable dans le temps?
yuk
@yuk Pas nécessairement, comme le suggère @whuber. Je pense à une autre application de la régression de Cox traitant du traitement du modèle systématique de réponses manquantes dans les tests éducatifs, car elle survient lorsqu'un étudiant n'a pas assez de temps pour terminer le test (les réponses manquantes pourraient alors être considérées comme censurées à droite) - - dans ce cas, c'est la commande d'articles qui est considérée comme l'échelle de temps. Je vais regarder l'article original (même si je pense que cela a également fait l'objet d'un doctorat).
chl
+1. Il y a d'autres papiers, mais je ne suis pas sûr qu'ils soient nécessairement meilleurs; Je pense que Chalise résume assez bien la situation.
ars
7
Non, ce n'est pas toujours le moment. De nombreuses réponses censurées peuvent être modélisées avec des techniques d'analyse de survie. Dans son livre Nondetects and Data Analysis , Dennis Helsel préconise d'utiliser le négatif d'une concentration à la place du temps (afin de faire face aux non-détectes qui, une fois annulés, deviennent des valeurs censurées à droite). Un synopsis est disponible sur le Web (format pdf) et un package R, NADA , le met en œuvre.
+1, merci d'avoir souligné le package NADA. J'ai remarqué que cela facilite la gestion des données censurées à gauche via le package de survie - la censure à gauche est-elle un scénario courant avec les données environnementales?
ars
@whuber: Merci pour le commentaire, le package NADA semble très intéressant.
yuk
@Andy: Merci pour les liens. Je pense que cela vaut la peine d'être une réponse. Je voterais positivement.
yuk
@Yuk, à votre demande, j'ai fait de mon commentaire une réponse, et @whuber merci pour votre exemple.
Andy W
@ars: Oui, la censure à gauche est caractéristique des données environnementales (et est une préoccupation clé de la chimiométrie en général). C'est un problème délicat et intéressant. Parmi les raisons, citons (1) les limites de censure sont elles-mêmes déterminées par des estimations statistiques (via un processus d'étalonnage), (2) la censure peut se produire de plusieurs manières - comme limites de détection, limites de quantification ou "limites de déclaration" ( 3) les seuils varient souvent en réponse à des covariables («interférences matricielles») qui peuvent être fortement corrélées avec les valeurs censurées d'origine, (4) les données sont souvent distribuées lognormalement.
whuber
4
Sur la question de l'âge par rapport à l'échelle du temps, chl a de bonnes références et capture l'essentiel - en particulier, l'exigence que l'ensemble à risque contienne suffisamment de sujets de tous âges comme cela se produirait dans une étude longitudinale.
Je voudrais seulement noter qu'il n'y a pas encore de consensus général à ce sujet, mais il existe une littérature suggérant que l'âge devrait être préféré comme échelle de temps dans certains cas. En particulier, si vous avez une situation où le temps ne s'accumule pas de la même manière pour tous les sujets, par exemple en raison d'une exposition à des matières toxiques, alors l'âge peut être plus approprié.
D'un autre côté, vous pouvez gérer cet exemple spécifique sur un modèle de Cox PH à échelle de temps en utilisant l'âge comme covariable variant dans le temps - plutôt qu'une covariable fixe à l'heure de début. Vous devez réfléchir au mécanisme derrière votre objet d'étude pour déterminer quelle échelle de temps est la plus appropriée. Parfois, il vaut la peine d'adapter les deux modèles aux données existantes pour voir si des écarts surviennent et comment ils peuvent être expliqués avant de concevoir votre nouvelle étude.
Enfin, la différence évidente dans l'analyse des deux est que sur une échelle d'âge, l'interprétation de la survie est par rapport à une échelle absolue (âge), alors que sur une échelle de temps, elle est relative à la date de début / entrée de l'étude .
À la demande du PO, voici une autre application que j'ai vu l'analyse de survie utilisée dans un contexte spatial (bien que manifestement différente de la mesure des substances environnementales mentionnées par whuber) modélise la distance entre les événements dans l'espace. Voici un exemple en criminologie et en voici un en épidémiologie .
Le raisonnement derrière l'utilisation de l'analyse de survie pour mesurer la distance entre les événements n'est pas pour autant un problème de censure (bien que la censure puisse certainement se produire dans un contexte spatial), elle l'est davantage en raison des distributions similaires entre les caractéristiques du temps par rapport à l'événement et la distance entre les événements caractéristiques (c.-à-d. qu'ils ont tous les deux des types similaires de structures d'erreur (souvent une décroissance de distance) qui violent l'OLS et donc les solutions non paramétriques sont idéales pour les deux).
En raison de mes mauvaises pratiques de citation, j'ai dû passer des heures à trouver le bon lien / référence au lien ci-dessus.
Pour l'exemple en criminologie,
Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada et Yutaka Harada. 2010. Une analyse spatio-temporelle de la victimisation quasi répétée au Japon . 8e Conférence nationale de cartographie du crime. Institut Jill Dando des sciences de la criminalité. PDF actuellement disponible sur la page Web référencée.
Non, ce n'est pas toujours le moment. De nombreuses réponses censurées peuvent être modélisées avec des techniques d'analyse de survie. Dans son livre Nondetects and Data Analysis , Dennis Helsel préconise d'utiliser le négatif d'une concentration à la place du temps (afin de faire face aux non-détectes qui, une fois annulés, deviennent des valeurs censurées à droite). Un synopsis est disponible sur le Web (format pdf) et un package R, NADA , le met en œuvre.
la source
Sur la question de l'âge par rapport à l'échelle du temps, chl a de bonnes références et capture l'essentiel - en particulier, l'exigence que l'ensemble à risque contienne suffisamment de sujets de tous âges comme cela se produirait dans une étude longitudinale.
Je voudrais seulement noter qu'il n'y a pas encore de consensus général à ce sujet, mais il existe une littérature suggérant que l'âge devrait être préféré comme échelle de temps dans certains cas. En particulier, si vous avez une situation où le temps ne s'accumule pas de la même manière pour tous les sujets, par exemple en raison d'une exposition à des matières toxiques, alors l'âge peut être plus approprié.
D'un autre côté, vous pouvez gérer cet exemple spécifique sur un modèle de Cox PH à échelle de temps en utilisant l'âge comme covariable variant dans le temps - plutôt qu'une covariable fixe à l'heure de début. Vous devez réfléchir au mécanisme derrière votre objet d'étude pour déterminer quelle échelle de temps est la plus appropriée. Parfois, il vaut la peine d'adapter les deux modèles aux données existantes pour voir si des écarts surviennent et comment ils peuvent être expliqués avant de concevoir votre nouvelle étude.
Enfin, la différence évidente dans l'analyse des deux est que sur une échelle d'âge, l'interprétation de la survie est par rapport à une échelle absolue (âge), alors que sur une échelle de temps, elle est relative à la date de début / entrée de l'étude .
la source
À la demande du PO, voici une autre application que j'ai vu l'analyse de survie utilisée dans un contexte spatial (bien que manifestement différente de la mesure des substances environnementales mentionnées par whuber) modélise la distance entre les événements dans l'espace. Voici un exemple en criminologie et en voici un en épidémiologie .
Le raisonnement derrière l'utilisation de l'analyse de survie pour mesurer la distance entre les événements n'est pas pour autant un problème de censure (bien que la censure puisse certainement se produire dans un contexte spatial), elle l'est davantage en raison des distributions similaires entre les caractéristiques du temps par rapport à l'événement et la distance entre les événements caractéristiques (c.-à-d. qu'ils ont tous les deux des types similaires de structures d'erreur (souvent une décroissance de distance) qui violent l'OLS et donc les solutions non paramétriques sont idéales pour les deux).
En raison de mes mauvaises pratiques de citation, j'ai dû passer des heures à trouver le bon lien / référence au lien ci-dessus.
Pour l'exemple en criminologie,
Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada et Yutaka Harada. 2010. Une analyse spatio-temporelle de la victimisation quasi répétée au Japon . 8e Conférence nationale de cartographie du crime. Institut Jill Dando des sciences de la criminalité. PDF actuellement disponible sur la page Web référencée.
En épidémiologie,
Lecteur, Steven. 2000. Utilisation de l'analyse de survie pour étudier les modèles de points spatiaux en épidémiologie géographique. Sciences sociales et médecine 50 (7-8): 985-1000.
la source