Comparaison des proportions sur deux échantillons, estimation de la taille de l'échantillon: R vs Stata

10

Comparaison des proportions sur deux échantillons, estimation de la taille de l'échantillon: R vs Stata

J'ai obtenu des résultats différents pour les tailles d'échantillon, comme suit:

Dans R

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

Résultat: (donc 161) pour chaque groupe.n=160.7777

In Stata

sampsi 0.70 0.85, power(0.90) alpha(0.05)

Résultat: pour chaque groupe.n=174

Pourquoi la différence? Merci.

BTW, j'ai exécuté le même calcul de taille d'échantillon dans SAS JMP , le résultat: (presque le même que le résultat R).n=160

dwstu
la source

Réponses:

7

La différence est due au fait que la sampsicommande de Stata (obsolète à partir de Stata 13 et remplacée par power) utilise la correction de continuité par défaut, contrairement à R power.prop.test()(pour plus de détails sur la formule utilisée par Stata, voir [PSS] power twoproportions ). Cela peut être modifié avec l' nocontinuityoption, par exemple,

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

ce qui donne un échantillon de 161 par groupe. L'utilisation de la correction de continuité donne un test plus conservateur (c.-à-d. Une plus grande taille d'échantillon), et évidemment importe moins lorsque la taille de l'échantillon augmente.

Frank Harrell, dans la documentation de bpower(une partie de son package Hmisc ), souligne que la formule sans la correction de continuité est assez précise, fournissant ainsi une justification pour renoncer à la correction.

Phil Schumm
la source
2
Très bonne réponse. Il semble que ce n'est pas la différence entre les deux méthodes dans mon article qui est la cause de la différence, mais le fait que l'une de ces méthodes utilise la correction de continuité et l'autre non.
Michael M
1
Merci. Avec seulement deux proportions (c'est-à-dire une table 2x2), peu importe si vous spécifiez l'alternative comme deux proportions ou une proportion et un rapport de cotes. Et puisque le test exact de Fisher est conservateur pour le problème binomial à deux échantillons, les estimations de puissance basées sur cela sont plus proches de celles de la formule corrigée de la continuité.
Phil Schumm
1
bsamsize(0.70, 0.85, alpha=0.05, power=0.90)n1=n2=160.7777