Supposons que j'ai construit un modèle de prédiction pour l'occurrence d'une maladie particulière dans un jeu de données (le jeu de données de construction du modèle) et que je souhaite maintenant vérifier l'efficacité du modèle dans un nouveau jeu de données (le jeu de données de validation). Pour un modèle construit avec une régression logistique, je calculerais la probabilité prédite pour chaque personne dans l'ensemble de données de validation sur la base des coefficients du modèle obtenus à partir de l'ensemble de données de construction du modèle, puis, après avoir dichotomisé ces probabilités à une certaine valeur seuil, je peux construire un tableau 2x2 cela me permet de calculer le vrai taux positif (sensibilité) et le vrai taux négatif (spécificité). De plus, je peux construire l'intégralité de la courbe ROC en variant la valeur seuil, puis obtenir l'ASC pour le graphique ROC.
Supposons maintenant que j'ai réellement des données de survie. J'ai donc utilisé un modèle de risques proportionnels de Cox dans le jeu de données de construction de modèle et je veux maintenant vérifier dans quelle mesure le modèle fonctionne dans le jeu de données de validation. Étant donné que le risque de base n'est pas une fonction paramétrique dans les modèles de Cox, je ne vois pas comment obtenir la probabilité de survie prédite pour chaque personne dans le jeu de données de validation en fonction des coefficients du modèle obtenus dans le jeu de données de construction du modèle. Alors, comment puis-je vérifier le fonctionnement du modèle dans l'ensemble de données de validation? Existe-t-il des méthodes établies pour ce faire? Et si oui, sont-ils implémentés dans un logiciel? Merci d'avance pour toute suggestion!
Je sais que cette question est assez ancienne mais ce que j'ai fait quand j'ai rencontré le même problème était d'utiliser la fonction de prédiction pour obtenir un "score" pour chaque sujet dans l'ensemble de validation. Cela a été suivi en divisant les sujets selon que le score était supérieur ou inférieur à la médiane et en traçant la courbe de Kaplan-Meier. Cela devrait montrer une séparation des sujets si votre modèle est prédictif. J'ai également testé la corrélation du score (en fait de son ln [pour une distribution normale]) avec la survie en utilisant la fonction coxph du package de survie dans R.
la source