Nous avons un biomarqueur potentiel pour prédire si un patient a un cancer ou non. Le résultat du test du biomarqueur est binaire positif ou négatif. Nous voulons avoir une idée de la quantité de patients qui doivent être testés pour déterminer si ce biomarqueur est un bon prédicteur ou non.
De la lecture sur Internet, il semble que le chemin à parcourir est de regarder la sensibilité (pour le nombre de cas) et la spécificité (pour le nombre de contrôles). Il est suggéré de traiter cette situation comme un test de proportion à un échantillon, mais il reste difficile de savoir comment procéder pour estimer la sensibilité et la plage à laquelle vous êtes prêt à l'exception. Si je considère que tout biomarqueur avec une sensibilité supérieure à 0,8 est "bon", comment définiriez-vous les deux variables? J'aimerais que mon hypothèse nulle soit que le biomarqueur n'est pas mieux qu'une assignation aléatoire c'est-à-dire une sensibilité de 0,5. Quelqu'un pourrait-il donner un exemple de la meilleure façon de le faire (surtout si c'est en R).
Réponses:
Parlons de sensibilité (que nous noterons ), la spécificité est similaire. Ce qui suit est une approche fréquentiste; ce serait formidable si l'un des Bayésiens ici pouvait ajouter une autre réponse pour discuter d'une autre façon de procéder.p
x
x
Il existe au moins deux approches - analytique et simulation. Le
pwr
paquetageR
existe déjà pour aider à cette conception - vous devez d'abord l'installer. Ensuite, vous aurez besoin d'une taille d'effet, puis la fonction que vous souhaitez estpwr.p.test
.Une fois que vous avez vos données, la façon d'exécuter le test est (je vais simuler les données à des fins d'argument).
EDIT: Si vous aimez mieux l'approche de simulation, vous pouvez le faire de cette façon: définissez
et laisse
runTest
êtredonc l'estimation de la puissance est
la source