Je suis un ingénieur logiciel qui cherche à construire un outil de test A / B. Je n'ai pas une solide expérience en statistiques, mais j'ai fait pas mal de lecture au cours des derniers jours.
Je suis la méthodologie décrite ici et résumerai les points pertinents ci-dessous.
L'outil permettra aux concepteurs et aux experts de domaine de configurer un site Web pour répartir le trafic reçu à une URL spécifique entre deux ou plusieurs URL. Par exemple, le trafic arrivant sur http://example.com/hello1 peut être réparti entre http://example.com/hello1 et http://example.com/hello2 . Le trafic serait réparti également entre les URL cibles et les performances des processus marketing à chacune des URL cibles seront comparées.
Dans cette expérience, la taille de l'échantillon N
correspondra aux visiteurs. Le test mesurera les «conversions», un terme décrivant quand un visiteur s'engage dans une action spécifique dans un processus de marketing. Les conversions sont exprimées en pourcentages et un taux de conversion plus élevé est souhaitable. Cela fait du test une comparaison de proportions indépendantes. L'outil doit pouvoir être facilement utilisé pour produire des tests avec des résultats sûrs. Il N
est important de sélectionner une valeur appropriée pour .
Dans l'article lié ci-dessus, une analyse de puissance de deux proportions indépendantes est utilisée pour trouver N
. Cette méthode nécessite de connaître à l'avance le taux de conversion du contrôle et de spécifier l'amélioration de conversion souhaitée. Il spécifie également un niveau de signification de 95% et une puissance statistique de 80%.
Des questions:
- Est-ce cette méthode de détermination du
N
son? Dans l'affirmative, quelle est la manière la plus sûre de déterminer le taux de conversion du contrôle avant de commencer le test? - Existe-t-il des moyens solides de déterminer
N
qui n'exigent pas que l'on connaisse à l'avance les taux de conversion du contrôle? - La méthodologie de l' article lié est-elle solide? Sinon, existe-t-il des méthodes accessibles et facilement digestibles auxquelles vous pourriez me lier?
À mon humble avis, dans la mesure où il va, le poste va dans la bonne direction. Toutefois:
La méthode proposée fait implicitement deux hypothèses: le taux de conversion de référence et la quantité attendue de changement. La taille de l'échantillon dépend beaucoup de la qualité avec laquelle vous répondez à ces hypothèses. Je vous recommande de calculer les tailles d'échantillon requises pour plusieurs combinaisons de p1 et p2 que vous jugez réalistes. Cela vous donnera une idée de la fiabilité réelle du calcul de la taille de l'échantillon.
Donc, si le taux de conversion réel est de 9% au lieu de 10%, vous avez besoin de 2000 autres cas pour chaque scénario pour détecter le taux de conversion de 10% plus que de référence du nouveau formulaire.
Une fois le test terminé, vous pouvez calculer les intervalles de confiance pour les proportions en fonction de vos observations réelles.
sig.level
la source
Au lieu de calculer des intervalles qui se chevauchent, vous calculez le score Z. Ceci est algorithmiquement plus facile à implémenter et vous obtiendrez des bibliothèques statistiques pour vous aider.
Jetez un œil: https://onlinecourses.science.psu.edu/stat200/node/53
la source