Le contexte
J'essaie de comprendre comment coxph () de R accepte et gère les entrées répétées pour les sujets (ou le patient / client si vous préférez). Certains appellent ce format long, d'autres l'appellent «mesures répétées».
Voir par exemple l'ensemble de données qui inclut la colonne ID dans la section Réponses à:
Meilleurs packages pour les modèles Cox avec des covariables variant dans le temps
Supposons également que les covariables varient dans le temps et qu'il existe exactement une variable de censure (c'est-à-dire un événement), qui est binaire.
Des questions
1) Dans la réponse du lien ci-dessus, si ID n'est pas donné comme paramètre dans l'appel à coxph (), les résultats devraient-ils être les mêmes que l'inclusion de cluster (ID) comme paramètre dans coxph ()?
J'ai tenté de rechercher de la documentation, mais les éléments suivants ne semblent pas aborder clairement (1): https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
2) Si la réponse à (1) est «non», alors (mathématiquement) pourquoi? Il semble que cluster () dans coxph () cherche des corrélations entre les sujets selon la sous-section «cluster» à la p. 20 à
https://cran.r-project.org/web/packages/survival/survival.pdf
3) Question vague: comment le coxph () avec des mesures répétées se compare-t-il aux méthodes de régression de Frailtypack de R?
Addenda
Les conseils suivants sur l'utilisation du cluster (ID):
Existe-t-il une version prenant en compte les mesures répétées du test du logrank?
de même que:
https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
Approche GEE: ajouter "+ cluster (sujet)" à l'énoncé du modèle dans coxph Approche des modèles mixtes: ajouter "+ (1 | sujet)" à l'énoncé du modèle dans coxme.
Merci d'avance!
Voici une réponse d'une
survival
vignette de package que j'ai trouvée utile - elle est liée dans la première réponse à la première question à laquelle vous avez lié:Meilleurs packages pour les modèles Cox avec des covariables variant dans le temps
Ils font référence à la configuration de données de formulaire long, ou aux données avec des entrées répétées pour les sujets.
L'exemple qu'ils donnent est
suggérant que si vous fournissez deux fois (début et fin de période) à
Surv
au lieu d'une, vouscoxph()
comprendrez le reste.la source