Un patient est admis à l'hôpital. Leur durée de séjour dépend de deux choses: la gravité de leur blessure et le montant que leur assurance est prête à payer pour les garder à l'hôpital. Certains patients partiront prématurément si leur assurance décide de ne plus payer leur séjour.
Supposons ce qui suit:
1) La durée de séjour est répartie en poisson (supposez simplement ceci pour l'instant, cela peut ou non être une hypothèse réaliste) avec le paramètre .
2) Divers plans d'assurance couvrent les séjours de 7, 14 et 21 jours. De nombreux patients partiront après 7, 14 ou 21 jours de séjour (car leur assurance est épuisée et ils doivent partir).
Si je devais obtenir des données de ce processus, cela pourrait ressembler à ceci:
Comme vous pouvez le voir, il y a des pointes aux 7, 14 et 21 jours. Ce sont des patients qui partent à la fin de leur assurance.
De toute évidence, les données peuvent être modélisées comme un mélange. J'ai du mal à écrire la probabilité de cette distribution. C'est comme un poisson gonflé à zéro, mais l'inflation est à 7, 14 et 21.
Quelle est la probabilité de ces données? Quel est le processus de réflexion derrière la probabilité?
la source
Réponses:
Dans ce cas, je crois qu'un chemin vers une solution existe si nous mettons notre chapeau d'analyse de survie. Notez que même si ce modèle n'a pas de sujets censurés (au sens traditionnel), nous pouvons toujours utiliser l'analyse de survie et parler des dangers des sujets.
Nous devons modéliser trois choses dans cet ordre: i) le risque cumulatif, ii) le danger, iii) la probabilité logarithmique.
Maintenant, nous voulons ajouter les "risques" de l'assurance qui s'épuise. La bonne chose à propos des dangers cumulatifs est qu'ils sont additifs, nous devons donc simplement ajouter des "risques" aux moments 7, 14, 21:
Brancher notre risque cumulatif et simplifier:
iii) Enfin, écrire le log vraisemblance pour les modèles de survie (sans censure) est super facile une fois que nous avons le danger et le risque cumulatif:
Et voilà!
La preuve est dans le pudding. Faisons quelques simulations et inférences en utilisant la sémantique du modèle personnalisé des lignes de vie .
¹ voir la section 1.2 ici
la source