J'effectue un test de qualité d'ajustement chi carré (GOF) avec trois catégories et je veux spécifiquement tester la valeur nulle que les proportions de population dans chaque catégorie sont égales (c'est-à-dire que la proportion est de 1/3 dans chaque groupe):
DONNÉES OBSERVÉES
Groupe 1 Groupe 2 Groupe 3 Total
686928 1012 2626
Ainsi, pour ce test GOF, les comptes attendus sont 2626 (1/3) = 875,333 et le test donne une valeur p très significative <0,0001.
Maintenant, il est évident que le groupe 1 est significativement différent de 2 et 3, et il est peu probable que 2 et 3 soient significativement différents. Cependant, si je voulais tester tous ces éléments de manière formelle et pouvoir fournir une valeur de p pour chaque cas, quelle serait la méthode appropriée?
J'ai cherché partout en ligne et il semble qu'il y ait des opinions divergentes, mais sans documentation officielle. Je me demande s'il existe un texte ou un article révisé par des pairs qui traite de cela.
Ce qui me semble raisonnable est, à la lumière du test global significatif, de faire des tests z pour la différence dans chaque paire de proportions, éventuellement avec une correction de la valeur (peut-être Bonferroni, par exemple).
Réponses:
À ma grande surprise, quelques recherches ne semblaient pas avoir abouti à une discussion préalable sur le post hoc pour la qualité de l'ajustement; Je suppose qu'il y en a probablement un ici, mais comme je ne peux pas le localiser facilement, je pense qu'il est raisonnable de transformer mes commentaires en réponse, afin que les gens puissent au moins trouver celui-ci en utilisant les mêmes termes de recherche que je viens d'utiliser.
Les comparaisons par paire que vous cherchez à faire (à condition de ne comparer que les deux groupes impliqués) sont raisonnables.
Cela revient à prendre des paires de groupes et à tester si la proportion dans l'un des groupes diffère de 1/2 (un test de proportions à un échantillon). Cela - comme vous le suggérez - peut être effectué comme un test z (bien que le test binomial et la qualité d'ajustement chi carré fonctionneraient également).
Bon nombre des approches habituelles pour traiter le taux d'erreur global de type I devraient fonctionner ici (y compris Bonferroni - ainsi que les problèmes habituels qui peuvent en découler).
la source
so you suggest compare 16 and 14 against 15/15
@Niksr, non. Glen compare les deux groupes en50/50
pourcentage. Le 3e groupe est exclu de la comparaison.J'ai eu le même problème (et j'étais heureux de trouver ce message). J'ai également trouvé une courte note sur la question dans Sheskin (2003: 225) que je voulais juste partager:
"Un autre type de comparaison qui peut être effectué consiste à ne comparer que deux des six cellules d'origine. Spécifiquement, supposons que nous voulons comparer la cellule l / lundi avec la cellule 2 / mardi [...] Notez que dans le exemple ci-dessus, puisque nous n'utilisons que deux cellules, la probabilité pour chaque cellule sera π_i = 1/2. La fréquence attendue de chaque cellule est obtenue en multipliant π_i = 1/2 par le nombre total d'observations dans les deux cellules (qui est égal à 34). Comme indiqué précédemment, lors d'une comparaison telle que celle ci-dessus, le chercheur doit se pencher sur la valeur alpha à utiliser pour évaluer l'hypothèse nulle.
Sheskin, DJ 2003. Manuel des procédures statistiques paramétriques et non paramétriques: troisième édition. CRC Press.
la source