Test d'hypothèse pour l'égalité des proportions avec 3 échantillons

9

J'ai un ensemble de données d'informations sur les clients de téléphones portables avec deux colonnes. La première colonne contient la certaine catégorie dans laquelle un compte appartient (A, B ou C) et la deuxième colonne contient une valeur binaire pour savoir si ce compte a été annulé. par exemple

A | cancelled
C | active
B | active
A | cancelled

ce que je veux faire est de trouver une sorte de test d'hypothèse pour tester si le ratio des comptes de type A, B et C est différent pour les comptes actifs par rapport aux comptes annulés - l'hypothèse nulle étant qu'ils sont les mêmes. Donc c'est comme un test d'hypothèse pour les proportions sauf que je ne sais pas comment faire ça pour 3 valeurs

user1893354
la source
6
Vous pouvez utiliser un test pour tester l'égalité des proportions entre les trois groupes. χ2
Je pense également que je pourrais faire trois tests d'hypothèse A contre B, B contre C et A contre C, pour voir s'ils sont différents
user1893354
5
Vous pouvez, mais sachez que vous devrez alors corriger les problèmes de comparaisons multiples.
Merci pour votre réponse. Je suis simplement curieux de savoir ce que vous entendez par problèmes de comparaisons multiples? Ou, plus précisément, pourquoi la méthode de test à trois hypothèses est désavantageuse. Merci!
user1893354
3
Vous avez deux problèmes avec l'utilisation de trois tests d'hypothèse. Premièrement, ils sont interdépendants car chaque paire réutilise certaines des données. Deuxièmement, s'ils étaient réellement indépendants, la probabilité qu'au moins l'un d'entre eux soit significatif même lorsque le zéro est vrai - c'est-à-dire le risque d'une fausse erreur positive - serait presque trois fois plus grande que la fausse souhaitée taux positif. Le deuxième problème indique que le test doit être ajusté, mais le premier montre que trouver l'ajustement approprié peut être problématique. L' approche évite ces problèmes. χ2
whuber

Réponses:

13

Je vais baser ma réponse en général et insérer des commentaires sur la façon dont votre problème s'intègre dans le cadre de test. En général, nous pouvons tester l'égalité des proportions en utilisant un test où l'hypothèse nulle typique, H 0 , est la suivante:χ2H0

H0:p1=p2=...=pk

c'est-à-dire que toutes les proportions sont égales les unes aux autres. Maintenant, dans votre cas, votre hypothèse nulle est la suivante:

H0:p1=p2=p3
HA: at leat one pi is different for i=1,2,3

χ2

χ2=i=1n(OiEi)2Ei

  • χ2χ2
  • Oi
  • Ei
  • n

n=6entrez la description de l'image ici

Maintenant, une fois que nous avons la statistique de test, nous avons deux options sur la façon de procéder pour terminer notre test d'hypothèse.

χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

Graphiquement (tous les nombres sont constitués), voici ce qui suit: entrez la description de l'image ici

χ2χ2<χ

df=(R1)×(C1)=(21)×(31)=1×2=2

ααχ(R1)×(C1)2

Graphiquement, nous avons cela entrez la description de l'image ici

où la valeur de p est calculée comme la zone qui est supérieure à notre statistique de test (la zone ombrée bleue dans l'exemple).

α>p-valueH0

αp-valueH0


la source