Analyse de survie pour la prédiction d'événements

9

Pour chaque enregistrement de mes ensembles de données, j'ai les informations suivantes

(X1 , ,Xm ,δ ,T )

sont des entités, δ est 1 si l'événement cible se produit et 0 sinon, et T est l'horodatage de l'événement survenu. En particulier, T pourrait être manquant s'il n'y avait pas d'événement ou s'il était programmé pour mettre fin au suivi.XiδTT

Je veux calculer un indice de risque pour chaque enregistrement de mon ensemble de données.

Je pensais opter pour un modèle de classification qui utilise les caractéristiques pour prédire la classe δ . Cependant, T est important: si l'événement δ est susceptible de se produire rapidement, le risque devrait être plus élevé.XiδTδ

C'est pourquoi une analyse de survie devrait être adaptée à ce problème. Je n'ai pas besoin de l'estimation complète de mais simplement d'un seul indice qui représente le risque pour un seul enregistrement.S(t)=P(T>t)

Le temps de survie moyen, qui peut être calculé pour chaque enregistrement, semble être un bon indice de risque - plus le risque est élevé.

Ma question est:

  1. L'analyse de survie est-elle adaptée à mes besoins?
  2. Comment puis-je évaluer les performances de mon modèle?

c

c

Xi(t)

Simone
la source

Réponses:

3

L'analyse de survie est-elle adaptée à mes besoins?

La seule chose qui rend cela moins applicable à l'analyse de survie est:

TT

Vous devrez connaître la dernière période pendant laquelle la personne a été observée en vie pour la plupart des modèles. Sinon, il devrait être simple et applicable d'utiliser l'analyse de survie. Par exemple, le risque proportionnel de Cox avec survival::coxphdans R ou un modèle paramétrique avec survival::survreg.

Le temps de survie moyen, qui peut être calculé pour chaque enregistrement, semble être un bon indice de risque - plus le risque est élevé.

Oui, vous pouvez utiliser les temps de survie moyens ou simplement le prédicteur linéaire pour les deux premiers (classes de) modèles mentionnés.

Comment puis-je évaluer les performances de mon modèle?

cHmisc::rcorr.cens

Benjamin Christoffersen
la source