J'ai entendu parler de l'analyse de la survie et de l'analyse des données de la vie, mais je n'ai pas une vue d'ensemble.
Je me demandais quels sujets ils couvrent?
S'agit-il de statistiques pures ou simplement d'application de statistiques sur un domaine spécifique?
L'analyse de la date de vie fait-elle partie de l'analyse de la survie?
Merci et salutations!
À propos de l'analyse de survie
Dans l'analyse de survie, ou l'analyse de la durée de l'événement, la variable ou l'intérêt mesure le temps entre un point de départ et un point d'intérêt comme la mort due à une maladie. La variable de réponse est donc une variable positive qui, dans la plupart des cas, est asymétrique. En conséquence, l'hypothèse habituelle de normalité échoue et, par exemple, les techniques de régression classiques ne sont pas applicables. (Cependant, notez que parfois une transformation de la variable pourrait améliorer la situation). Mais la principale différence est la censure : une caractéristique très courante lors du traitement des données de délai. Dans sa forme la plus courante (censure à droite), vous ne connaissez pas l'heure exacte pour un individu donné mais vous savez qu'elle est supérieure à une valeur . Par exemple, supposons que vous suiviez un patient jusqu'à sa mort. Au moment t = 10 t = 30 t > 30 t ⋆ = 30t⋆ t=10 jours, il est vivant. Au temps jours, il est toujours en vie, mais il est perdu de vue. Alors vous ne connaissez pas l'heure exacte de la mort mais vous savez que . Ignorer la censure n'est clairement pas la meilleure chose à faire; à la place, vous pouvez enregistrer comme observation censurée. Les techniques d'analyse de survie (par exemple, estimateur de Kaplan-Meier, régression de Cox, ...) sont spécialement conçues pour gérer la censure.t=30 t>30 t⋆=30
À mon avis, la modélisation des données de survie dans la recherche médicale est un très bon choix comme premier livre d'analyse de survie ... mais il y en a beaucoup d'autres.
la source
Une première description approximative de l'analyse de survie: Analyse des données où la variable dépendante a (1) des valeurs précises (les observations complètes) et (2) des valeurs connues pour être supérieures à un seuil donné (les observations censurées). Ce qui précède peut être un échantillon de données de survie, les valeurs sans
+
sont connues avec précision; les valeurs avec+
sont connues pour être plus, mais pas combien plus. (Et il existe de nombreuses extensions.)la source
Comme l'a souligné schenectady, la censure est le problème clé de l'analyse de survie. Sans observations censurées dans votre jeu de données, votre tâche n'a aucune différence avec une simple tâche de régression. Cela suggère également que la variable d'intérêt n'est pas limitée au temps , c'est- à - dire qu'elle peut être le salaire, le prix, etc.T
Par conséquent, il peut être plus approprié d'appeler cela une régression de censure ou une analyse de censure, au lieu d'une analyse de survie, je suppose.
la source