Disons que je veux savoir de quelle taille d'échantillon j'ai besoin pour une expérience dans laquelle je cherche à déterminer si la différence entre deux proportions de succès est statistiquement significative. Voici mon processus actuel:
- Examinez les données historiques pour établir des prévisions de base. Supposons que par le passé, une action donne lieu à un taux de réussite de 10% alors que ne pas prendre une action entraîne un taux de réussite de 9%. Supposons que ces conclusions n'ont pas été validées statistiquement mais qu'elles sont basées sur des quantités de données relativement importantes (10 000+ observations).
Branchez ces hypothèses dans power.prop.test pour obtenir les éléments suivants:
power.prop.test(p1=.1,p2=.11,power=.9) Two-sample comparison of proportions power calculation n = 19746.62 p1 = 0.1 p2 = 0.11 sig.level = 0.05 power = 0.9 alternative = two.sided
Donc, cela me dit que j'aurais besoin d'un échantillon de ~ 20000 dans chaque groupe d'un test A / B afin de détecter une différence significative entre les proportions.
L'étape suivante consiste à réaliser l'expérience avec 20 000 observations dans chaque groupe. Le groupe B (aucune mesure prise) a 2300 succès sur 20 000 observations, tandis que le groupe A (mesure prise) a 2200 succès sur 20 000 observations.
Faites un test prop.
prop.test(c(2300,2100),c(20000,20000)) 2-sample test for equality of proportions with continuity correction data: c(2300, 2100) out of c(20000, 20000) X-squared = 10.1126, df = 1, p-value = 0.001473 alternative hypothesis: two.sided 95 percent confidence interval: 0.003818257 0.016181743 sample estimates: prop 1 prop 2 0.115 0.105
Nous disons donc que nous pouvons rejeter l'hypothèse nulle selon laquelle les proportions sont égales.
Des questions
- Cette méthode est-elle valable ou du moins sur la bonne voie?
- Puis-je spécifier
alt="greater"
sur prop.test et faire confiance à la valeur de p même si power.prop.test était destiné à un test bilatéral? - Que se passe-t-il si la valeur de p est supérieure à 0,05 lors du test prop? Dois-je supposer que j'ai un échantillon statistiquement significatif mais qu'il n'y a pas de différence statistiquement significative entre les deux proportions? En outre, la signification statistique est-elle inhérente à la valeur de p dans le test prop. - c'est-à-dire que le test power.prop est même nécessaire?
- Que se passe-t-il si je ne peux pas effectuer une répartition 50/50 et que je dois faire, disons, une répartition 95/5? Existe-t-il une méthode pour calculer la taille de l'échantillon dans ce cas?
- Que faire si je n'ai aucune idée de ce que devrait être ma prédiction de base pour les proportions? Si je suppose que les proportions réelles sont très éloignées, cela invalidera-t-il mon analyse?
Toute autre lacune que vous pourriez combler serait très appréciée - mes excuses pour la nature alambiquée de ce poste. Je vous remercie!
>
au début du bloc cité) plutôt que de la mettre en gras.