Correction de continuité de Yates pour 2 x 2 tables de contingence

9

J'aimerais recueillir les commentaires des personnes sur le terrain au sujet de la correction de continuité Yates pour les tableaux de contingence 2 x 2. L'article de Wikipédia mentionne qu'il peut s'ajuster trop loin et n'est donc utilisé que dans un sens limité. Le poste connexe ici n'offre pas beaucoup plus d'informations.

Alors, pour les personnes qui utilisent régulièrement ces tests, que pensez-vous? Est-il préférable d'utiliser la correction ou non?

Et un exemple réel qui donnerait des résultats différents au niveau de confiance de 95%. Notez que c'était un problème de devoirs, mais notre classe ne traite pas du tout de la correction de continuité Yates, alors dormez doucement sachant que vous ne faites pas mes devoirs pour moi.

samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")

chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)    
Chasse
la source

Réponses:

6

La correction de Yates donne des tests plus conservateurs qu'avec les tests "exacts" de Fisher.

Voici un tutoriel en ligne sur l'utilisation de la correction de continuité de Yates , par Stefanescu et al, qui pointe clairement vers divers défauts de correction systématique pour la continuité (pp. 4-6). Citant Agresti ( CDA 2002), "Yates (1934) a mentionné que Fisher lui a suggéré l'hypergéométrique pour un test exact", ce qui a conduit à la version corrigée de la continuité du . Agresti a également indiqué que le test de Fisher est une bonne alternative maintenant que les ordinateurs peuvent le faire même pour de grands échantillons (p. 103). Maintenant, le fait est que le choix d'un test dépend vraiment de la question qui est posée et des hypothèses qui sont faites par chacun d'eux (par exemple, dans le cas du test de Fisher, nous supposons que les marges sont fixes).χ2

Dans votre cas, le test de Fisher et le corrigé sont d'accord et donnent une valeur supérieure à 5%. Dans le cas du ordinaire , si les valeurs de sont calculées en utilisant une approche de Monte Carlo (voir ), alors il n'atteint pas non plus la signification. p χ 2 pχ2pχ2psimulate.p.value

D'autres références utiles traitant des problèmes de petite taille d'échantillon et de la surutilisation du test de Fisher incluent:

chl
la source
Merci pour les références. J'ai pu trouver une version « pré-print » du papier Campbell ici pour ceux qui ne peuvent pas accéder à PubMed.
Chase
3

Si votre nombre de comptes est suffisamment bas pour que la correction de Yates soit un problème (comme dans votre exemple), vous devriez probablement utiliser le test exact de Fisher. Sinon, je recommande qu'après avoir utilisé le test du chi carré sur une table 2x2, vous confirmiez votre test avec un test z du rapport de cotes.

Mike Anderson
la source
Pourquoi comparer avec un log odds ratio z- test? C'est un test Wald, et les tests Wald sont généralement moins performants que les tests de score tels que le test du chi carré de Pearson. Est-ce connu pour être une exception?
2010 à 9h11
Merci pour l'information! Le test de Fisher semble être une méthode plus robuste pour des questions comme celles-ci. Je ne pense pas que le cours que je suis en train de suivre abordera le test de Fisher, mais je vais certainement le garder à l'esprit pour les applications réelles.
Chase