J'espère que quelqu'un pourra m'aider avec quel modèle (fragilité, strate ou cluster) je devrais utiliser pour mes données. J'ai couplé des données, je dois donc en tenir compte lors de la modélisation du Cox PH et je ne sais pas quel modèle me donnera un résultat plus précis.
Mon étude portait sur le temps qu'il fallait à une personne pour se calmer après avoir été soumise à un stimulus particulier. Chaque personne a été soumise à deux stimuli différents, des jours différents. Ils ont été assignés au hasard quel stimulus était le premier. J'ai modélisé cela avec une analyse de survie (time-to-event) mais je dois maintenant tenir compte du fait que les données sont appariées.
Toute aide concernant le moment où vous utiliserez des modèles de fragilité, de strates ou de grappes serait utile.
Réponses:
Ce sujet est couvert par un certain nombre d'articles, notamment:
Voici un résumé très bref (et non exhaustif) des différences entre les deux approches.
Approche stratifiée
Pour chaque paire, il existe une fonction de risque de base non spécifiée. L'idée de vraisemblance partielle est facilement adaptée en multipliant les probabilités partielles propres à chaque strate.
Avantages :
Inconvénients :
Approche de fragilité
L'association intra-paire s'explique par un effet aléatoire commun aux deux membres de la même paire. Par conséquent, il existe à nouveau un risque de base différent pour chaque paire, mais ils ne sont pas totalement non spécifiés; il y a une certaine structure. L'estimation est basée sur la vraisemblance marginale.
Avantages :
Inconvénients :
coxph()
ouparfm()
; dans SAS, vous pouvez regarderproc phreg
);En conclusion, le choix dépend de votre recherche. Cependant, la dernière référence de la liste donne quelques indications:
Pour les situations où la taille du groupe est de cinq ou plus, il est difficile de justifier l'utilisation du modèle à effets aléatoires par rapport à celui du modèle stratifié, ce dernier modèle étant beaucoup plus facile à mettre en œuvre. L'histoire change pour les tailles de groupe inférieures à cinq et, pour les études jumelles en particulier, les gains d'efficacité sont tels que nous préférerions utiliser un modèle à effets aléatoires plutôt qu'un modèle stratifié. Le modèle stratifié reste valide mais peut nécessiter de 20% à 30% d'observations supplémentaires pour obtenir la même précision.
la source