Analyse de survie pour la prédiction d'événements

Pour chaque enregistrement de mes ensembles de données, j'ai les informations suivantes

(X_{1}, \dots, X_{m}, δ, T)

$(X_1 \ , \dots \ , X_m \ , \delta \ , T \ )$

où sont des entités, est 1 si l'événement cible se produit et 0 sinon, et est l'horodatage de l'événement survenu. En particulier, pourrait être manquant s'il n'y avait pas d'événement ou s'il était programmé pour mettre fin au suivi. $X_i$ $\delta$ $T$ $T$

Je veux calculer un indice de risque pour chaque enregistrement de mon ensemble de données.

Je pensais opter pour un modèle de classification qui utilise les caractéristiques pour prédire la classe . Cependant, est important: si l'événement est susceptible de se produire rapidement, le risque devrait être plus élevé. $X_i$ $\delta$ $T$ $\delta$

C'est pourquoi une analyse de survie devrait être adaptée à ce problème. Je n'ai pas besoin de l'estimation complète de mais simplement d'un seul indice qui représente le risque pour un seul enregistrement. $S(t) = P(T>t)$

Le temps de survie moyen, qui peut être calculé pour chaque enregistrement, semble être un bon indice de risque - plus le risque est élevé.

Ma question est:

L'analyse de survie est-elle adaptée à mes besoins?
Comment puis-je évaluer les performances de mon modèle?

$c$

$c$

$X_i(t)$

classification survival Simone
la source

Réponses:

L'analyse de survie est-elle adaptée à mes besoins?

La seule chose qui rend cela moins applicable à l'analyse de survie est:

$TT$

Vous devrez connaître la dernière période pendant laquelle la personne a été observée en vie pour la plupart des modèles. Sinon, il devrait être simple et applicable d'utiliser l'analyse de survie. Par exemple, le risque proportionnel de Cox avec survival::coxphdans R ou un modèle paramétrique avec survival::survreg.

Le temps de survie moyen, qui peut être calculé pour chaque enregistrement, semble être un bon indice de risque - plus le risque est élevé.

Oui, vous pouvez utiliser les temps de survie moyens ou simplement le prédicteur linéaire pour les deux premiers (classes de) modèles mentionnés.

Comment puis-je évaluer les performances de mon modèle?

$c$ Hmisc::rcorr.cens

Benjamin Christoffersen
la source