Comparaison de la CPH, du modèle de temps de défaillance accéléré ou des réseaux de neurones pour l'analyse de survie

10

Je suis nouveau dans l'analyse de survie et j'ai récemment appris qu'il existe différentes façons de le faire en fonction d'un certain objectif. Je suis intéressé par la mise en œuvre réelle et la pertinence de ces méthodes.

On m'a présenté les traditionnels risques proportionnels de Cox , les modèles de temps de défaillance accélérés et les réseaux de neurones (perceptron multicouche) comme méthodes pour obtenir la survie d'un patient compte tenu de son temps, de son statut et d'autres données médicales. L'étude devrait être déterminée sur cinq ans et l'objectif est de donner chaque année des risques de survie pour de nouveaux enregistrements.

J'ai trouvé deux cas où d'autres méthodes ont été choisies par rapport au PH de Cox:

  1. J'ai trouvé " Comment obtenir des prédictions en termes de temps de survie à partir d'un modèle Cox PH " et il a été mentionné que:

    Si vous êtes particulièrement intéressé à obtenir des estimations de la probabilité de survie à des moments particuliers, je vous orienterais vers des modèles de survie paramétriques (également appelés modèles de temps de défaillance accélérés) . Ceux-ci sont implémentés dans le package de survie pour R, et vous donneront des distributions de temps de survie paramétriques, dans lesquelles vous pouvez simplement brancher l'heure qui vous intéresse et récupérer une probabilité de survie.

    Je suis allé sur le site recommandé et en ai trouvé un dans le survivalpackage - la fonction survreg.

  2. Des réseaux de neurones ont été suggérés dans ce commentaire :

    ... Un avantage des approches neuronales de l'analyse de survie est qu'elles ne reposent pas sur les hypothèses qui sous-tendent l'analyse de Cox ...

    Une autre personne avec la question « Modèle de réseau neuronal R avec vecteur cible en sortie contenant des prédictions de survie » a donné un moyen exhaustif de déterminer la survie à la fois dans les réseaux neuronaux et Cox PH.

    Le code R pour obtenir la survie serait comme ceci:

    mymodel <- neuralnet(T1+T2+T3+T4+T5~covar1+covar2+covar3+..., data=mydata, hidden=1)
    compute(mymodel,data=mydata)
  3. Je suis allé sur les forums R et j'ai trouvé cette réponse dans la question " prédire.coxph et prédire.survreg " :

    En effet, à partir de la predict()fonction du, coxphvous ne pouvez pas obtenir directement des prédictions «temporelles», mais uniquement des scores de risque linéaires et exponentiels. En effet, pour obtenir l'heure, un aléa de base doit être calculé et il n'est pas simple car il est implicite dans le modèle de Cox.

Je me demandais si lequel des trois (ou deux considérant les arguments sur Cox PH) est le meilleur pour obtenir des pourcentages de survie pour les périodes d'intérêt? Je ne sais pas lequel d'entre eux utiliser dans l'analyse de survie.

Final Litiu
la source

Réponses:

9

Cela dépend de la raison pour laquelle vous créez des modèles. Deux raisons principales pour construire des modèles de survie sont (1) de faire des prédictions ou (2) de modéliser les tailles d'effet des covariables.

Si vous souhaitez les utiliser dans un cadre prédictif dans lequel vous souhaitez obtenir un temps de survie attendu compte tenu d'un ensemble de covariables, les réseaux de neurones sont probablement le meilleur choix car ils sont des approximateurs universels et font moins d'hypothèses que l'habituel (semi-) paramétrique des modèles. Une autre option moins populaire mais non moins puissante est la prise en charge des machines vectorielles .

Si vous modélisez pour quantifier la taille des effets, les réseaux de neurones ne seront pas très utiles. Les modèles à risques proportionnels de Cox et à temps de défaillance accéléré peuvent être utilisés à cette fin. Les modèles Cox PH sont de loin les plus utilisés en milieu clinique, dans lesquels le rapport de risque donne une mesure de la taille de l'effet pour chaque covariable / interaction. Dans les paramètres d'ingénierie, cependant, les modèles AFT sont l'arme de choix.

Marc Claesen
la source
1
Merci pour la réponse! Vous l'avez dit exactement - " pour obtenir un temps de survie attendu compte tenu d'un ensemble de covariables ". Je vais devoir aller avec les réseaux de neurones et les SVM dans mon étude.
Final Litiu
@Marc Claesen: Le modèle Cox PH fournit P (temps de survie> t). N'est-il pas possible d'obtenir le pdf du temps de survie à partir de là et un échantillon du pdf?
statBeginner
@Marc Claesen Je suppose que les réseaux de neurones ne peuvent pas être directement appliqués au problème d'analyse de survie mais le problème d'analyse de survie doit d'abord être converti en un problème de classification ou de régression. Pouvez-vous donc expliquer comment un problème d'analyse de survie peut être converti en un problème de classification ou de régression afin que les réseaux de neurones puissent être appliqués? Veuillez répondre ici si possible stats.stackexchange.com/questions/199549/…
GeorgeOfTheRF