Test post-hoc pour le test de qualité d'ajustement du chi carré

16

J'effectue un test de qualité d'ajustement chi carré (GOF) avec trois catégories et je veux spécifiquement tester la valeur nulle que les proportions de population dans chaque catégorie sont égales (c'est-à-dire que la proportion est de 1/3 dans chaque groupe):

                DONNÉES OBSERVÉES
Groupe 1     Groupe 2     Groupe 3     Total
  686928 1012 2626

Ainsi, pour ce test GOF, les comptes attendus sont 2626 (1/3) = 875,333 et le test donne une valeur p très significative <0,0001.

Maintenant, il est évident que le groupe 1 est significativement différent de 2 et 3, et il est peu probable que 2 et 3 soient significativement différents. Cependant, si je voulais tester tous ces éléments de manière formelle et pouvoir fournir une valeur de p pour chaque cas, quelle serait la méthode appropriée?

J'ai cherché partout en ligne et il semble qu'il y ait des opinions divergentes, mais sans documentation officielle. Je me demande s'il existe un texte ou un article révisé par des pairs qui traite de cela.

Ce qui me semble raisonnable est, à la lumière du test global significatif, de faire des tests z pour la différence dans chaque paire de proportions, éventuellement avec une correction de la valeur (peut-être Bonferroni, par exemple).α

Meg
la source
les tests t ne conviendraient pas. Vous pouvez faire des tests d'adéquation par paire (tests de proportions). Quelles opinions divergentes avez-vous trouvées?
Glen_b -Reinstate Monica
Désolé - je voulais dire z-test (pour la différence en deux proportions). Je vais éditer.
Meg
Ce lien dit de regrouper tous les autres groupes par rapport à celui qui nous intéresse (c'est pour le test exact de Fisher, mais ce lien est redirigé depuis un autre lien sur le chi carré, où l'auteur dit d'appliquer la même méthode pour le chi carré comme pour le Fisher's exact): biostathandbook.com/exactgof.html#posthoc Mais ce n'est pas vraiment ce que je veux - je veux par paire, pas un groupe contre tous les autres.
Meg
1
La plupart des autres sources que je trouve parlent d'un paramètre de table de contingence, pas d'un test GOF.
Meg
Oui, vous pouvez effectuer des tests de proportions (que ce soit en tant que test z à un échantillon ou test binomial ou test khi carré) de chaque comparaison par paire. Vous n'avez pas besoin de faire des comparaisons un contre tous.
Glen_b -Reinstate Monica

Réponses:

8

À ma grande surprise, quelques recherches ne semblaient pas avoir abouti à une discussion préalable sur le post hoc pour la qualité de l'ajustement; Je suppose qu'il y en a probablement un ici, mais comme je ne peux pas le localiser facilement, je pense qu'il est raisonnable de transformer mes commentaires en réponse, afin que les gens puissent au moins trouver celui-ci en utilisant les mêmes termes de recherche que je viens d'utiliser.

Les comparaisons par paire que vous cherchez à faire (à condition de ne comparer que les deux groupes impliqués) sont raisonnables.

Cela revient à prendre des paires de groupes et à tester si la proportion dans l'un des groupes diffère de 1/2 (un test de proportions à un échantillon). Cela - comme vous le suggérez - peut être effectué comme un test z (bien que le test binomial et la qualité d'ajustement chi carré fonctionneraient également).

Bon nombre des approches habituelles pour traiter le taux d'erreur global de type I devraient fonctionner ici (y compris Bonferroni - ainsi que les problèmes habituels qui peuvent en découler).

Glen_b -Reinstate Monica
la source
Merci pour vos conseils et pour votre réponse. Moi aussi, j'ai été un peu surpris que ce problème ne soit apparemment pas venu pour le cas GOF.
Meg
1
J'ai également été surpris car cette question n'est pas discutée. J'ai trouvé la même solution que Glen, mais j'ai encore des doutes. Premièrement, chaque paire n'est pas indépendante de l'échantillon "global". Par exemple, imaginez que nous en avons 70,16,14, alors vous proposez de comparer 16 et 14 contre 15/15. Cependant, dans d'autres observations, il pourrait être de 72,14,14. c'est-à-dire que la source de «supériorité» dans la paire pourrait ne pas être une contrepartie dans la paire. Deuxièmement, devrions-nous appliquer un ajustement de groupe comme Bonferroni si les choix n'étaient pas réellement indépendants? Troisièmement, devrions-nous distinguer si le choix était mutuellement exclusif ou c'était un choix multiple?
Niksr
Je suis curieux, pourrait-il être possible d'employer Cochran Q-test avec McNemar post-hoc à cet effet? Il semble que toutes les conditions pour ce test soient remplies: 1) stade de contrôle - distribution régulière 2) événement - réaction sur les stimuli 3) il s'agit d'une comparaison de paires (entre le choix aléatoire hypothétique et le choix réel) 4) nulle - la réaction sur le stimulus est différente du hasard
Niksr
so you suggest compare 16 and 14 against 15/15@Niksr, non. Glen compare les deux groupes en 50/50pourcentage. Le 3e groupe est exclu de la comparaison.
ttnphns
Oui, je voulais dire que 16 et 14 sont des cas, pas des pourcentages.
Niksr
3

J'ai eu le même problème (et j'étais heureux de trouver ce message). J'ai également trouvé une courte note sur la question dans Sheskin (2003: 225) que je voulais juste partager:

"Un autre type de comparaison qui peut être effectué consiste à ne comparer que deux des six cellules d'origine. Spécifiquement, supposons que nous voulons comparer la cellule l / lundi avec la cellule 2 / mardi [...] Notez que dans le exemple ci-dessus, puisque nous n'utilisons que deux cellules, la probabilité pour chaque cellule sera π_i = 1/2. La fréquence attendue de chaque cellule est obtenue en multipliant π_i = 1/2 par le nombre total d'observations dans les deux cellules (qui est égal à 34). Comme indiqué précédemment, lors d'une comparaison telle que celle ci-dessus, le chercheur doit se pencher sur la valeur alpha à utiliser pour évaluer l'hypothèse nulle.

Sheskin, DJ 2003. Manuel des procédures statistiques paramétriques et non paramétriques: troisième édition. CRC Press.

Karen
la source