Nous testons une campagne de marketing par e-mail. Lors de notre test initial, nous avons envoyé deux types d'e-mails différents et un troisième groupe de contrôle n'a pas reçu d'e-mail. Maintenant, nous récupérons les "résultats" en proportion des utilisateurs qui sont revenus sur notre application. Voici les résultats:
Group | received e-mail | returned | %-returned
A | 16,895 | 934 | 5.53%
B | 17,530 | 717 | 4.09%
C | 42408 | 1618 | 3.82%
Il semble que le groupe A puisse être meilleur que B et C, mais quel est le bon test pour le prouver?
Réponses:
Dans un tableau comme celui-ci, vous pouvez partitionner la statistique G produite par un test G, plutôt que de calculer les OR ou en exécutant une régression logistique. Bien que vous deviez décider comment vous allez le partitionner. Ici, la statistique G, qui est similaire à X ^ 2 de Pearson et suit également une distribution X ^ 2, est:
G = 2 * somme (OBS * ln (OBS / EXP)).
Vous calculez d'abord cela pour le tableau global, dans ce cas: G = 76,42, sur 2 df, ce qui est très significatif (p <0,0001). C'est-à-dire que le taux de retour dépend du groupe (A, B ou C).
Ensuite, comme vous avez 2 df, vous pouvez effectuer deux tests G plus petits de 1 df (2x2). Cependant, après avoir effectué le premier, vous devez réduire les lignes des deux niveaux utilisés dans le premier test, puis utiliser ces valeurs pour les comparer au troisième niveau. Ici, disons que vous testez d'abord B contre C.
Cela produit un G-stat de 2,29 sur 1 df, ce qui n'est pas significatif (p = 0,1300). Créez ensuite un nouveau tableau en combinant les lignes B et C. Maintenant, testez A contre B + C.
Cela produit un G-stat de 74,13, sur 1 df, ce qui est également très significatif (p <0,0001).
Vous pouvez vérifier votre travail en ajoutant les deux statistiques de test les plus petites, qui doivent être égales à la statistique de test la plus grande. Il fait: 2,29 + 74,13 = 76,42
L'histoire ici est que vos groupes B et C ne sont pas significativement différents, mais ce groupe A a un taux de retour plus élevé que B et C combinés.
J'espère que cela pourra aider!
Vous auriez également pu partitionner la G-stat différemment en comparant d'abord A à B, puis C à A + B, ou en comparant A à C, puis B à A + C. De plus, vous pouvez l'étendre à 4 groupes ou plus, mais après chaque test, vous devez réduire les deux lignes que vous venez de tester, avec un nombre maximal de tests égal au df dans votre table d'origine. Il existe d'autres façons de partitionner avec des tables plus compliquées. Le livre d'Agresti, "Analyse des données catégoriques", devrait contenir les détails. Plus précisément, son chapitre sur l'inférence pour les tableaux de contingence bidirectionnels.
la source
Je calculerais simplement les rapports de cotes (ou de risque) entre le groupe A et B, entre B et C et entre A et C et voir s'ils sont statistiquement différents. Je ne vois pas de raison de faire un test de proportions "omnibus" dans ce cas puisque vous n'avez que trois groupes. Trois tests du chi carré pourraient également faire l'affaire.
Comme certains des individus l'ont souligné dans les commentaires ci-dessous, une régression logistique avec des contrastes prévus fonctionnerait bien aussi.
la source