J'essaie d'avoir de l'intuition pour chacune des principales fonctions de la science actuarielle (en particulier pour le modèle des risques proportionnels de Cox). Voici ce que j'ai jusqu'à présent:
- : à partir de l'heure de début, la distribution de probabilité de votre décès.
- : juste la distribution cumulative. Au temps , quel% de la population sera morte?
- : . Au temps , quel% de la population sera en vie?
- : fonction de danger. A un instant donné , des personnes encore en vie, cela peut être utilisé pour estimer combien de personnes mourront dans l'intervalle de temps suivant, ou si intervalle-> 0, la probabilité de décès «instantané».
- : danger cumulatif. Aucune idée.
Quelle est l'idée derrière la combinaison des valeurs de danger, surtout lorsqu'elles sont continues? Si nous utilisons un exemple discret avec des taux de mortalité sur quatre saisons, et la fonction de risque est la suivante:
- À partir du printemps, tout le monde est vivant et 20% mourront
- Maintenant en été, parmi ceux qui restent, 50% mourront
- Maintenant, à l'automne, parmi ceux qui restent, 75% mourront
- La dernière saison est l'hiver. De ceux qui restent, 100% mourront
Le risque cumulatif est alors de 20%, 70%, 145%, 245% ?? Qu'est-ce que cela signifie et pourquoi est-ce utile?
Réponses:
Combiner les proportions de mourir comme vous ne vous donne pas de risque cumulatif. Le taux de risque en temps continu est une probabilité conditionnelle que pendant un intervalle très court un événement se produise:
Le danger cumulatif intègre le taux de danger (instantané) au fil des âges / du temps. C'est comme résumer les probabilités, mais comme est très faible, ces probabilités sont également de petits nombres (par exemple, le taux de risque de mourir peut être d'environ 0,004 à des âges d'environ 30 ans). Le taux de risque est subordonné au fait de ne pas avoir vécu l'événement avant t , donc pour une population, il peut totaliser plus de 1.Δt t
Vous pouvez rechercher une table de mortalité humaine, bien qu'il s'agisse d'une formulation à temps discret, et essayer d'accumuler .mx
Si vous utilisez R, voici un petit exemple d'approximation de ces fonctions à partir du nombre de décès à chaque intervalle d'âge d'un an:
J'espère que cela t'aides.
la source
Le livre "An Introduction to Survival Analysis Using Stata" (2nd Edition) de Mario Cleves contient un bon chapitre sur ce sujet.
Vous pouvez trouver le chapitre sur Google Books , p. 13-15. Mais je conseillerais de lire tout le chapitre 2.
Voici la forme courte:
la source
Je dirais DANGER que c'est remarquable en raison de son utilisation dans les parcelles de diagnostic:
la source
En paraphrasant ce que dit @Scortchi, je voudrais souligner que la fonction de risque cumulatif n'a pas une bonne interprétation, et en tant que telle, je n'essaierais pas de l'utiliser comme un moyen d'interpréter les résultats; dire à un chercheur non statistique que les risques cumulatifs sont différents entraînera très probablement une réponse "mm-hm" et ensuite il ne posera plus de questions sur le sujet, et pas dans le bon sens.
Cependant, la fonction de risque cumulatif s'avère très utile mathématiquement, comme un moyen général de relier la fonction de danger et la fonction de survie. Il est donc important de savoir quel est le danger cumulatif et comment il peut être utilisé dans diverses méthodes statistiques. Mais en général, je ne pense pas qu'il soit particulièrement utile de penser à des données réelles en termes de risques cumulatifs.
la source