Je suis concepteur de logiciels de métier et je travaille sur un projet pour un client, et je voudrais m'assurer que mon analyse est statistiquement solide.
Considérez ce qui suit: Nous avons n publicités (n <10), et nous voulons simplement savoir quelle publicité est la plus performante. Notre serveur publicitaire diffusera au hasard l'une de ces annonces. Le succès est si un utilisateur clique sur l'annonce - notre serveur en garde la trace.
Éléments fournis: intervalle de confiance: 95%
Question: Quelle est la taille estimée de l'échantillon? (Combien d'annonces au total devons-nous diffuser), pourquoi? (souviens-toi que je suis un mannequin)
Merci
anova
sample-size
t-test
rule-of-thumb
Jonathan
la source
la source
Réponses:
Le test que vous voulez probablement est le test exact de Fisher . Malheureusement, étant donné le taux de clics probablement très faible et la petite taille d'effet attendue, vous aurez besoin d'un énorme N pour atteindre l'intervalle de confiance que vous souhaitez. Disons que le "vrai" taux de clics de votre meilleure annonce est de 0,11 et votre deuxième meilleur 0,1. De plus, supposons que vous souhaitiez que la probabilité que vous échouiez à tort à rejeter l'hypothèse nulle (qu'il n'y ait pas de différence entre les deux annonces) soit inférieure à 0,20. Si tel est le cas, vous aurez besoin d'un N de l'ordre de 10 000.
Comme l'a suggéré un intervenant, vous ne devriez probablement pas vous soucier d'une différence de 10% dans les performances des annonces. Pour des différences plus grossières, la taille nécessaire des échantillons diminue rapidement.
la source