Le chi-carré est-il toujours un test unilatéral?

48

Un article publié ( pdf ) contient ces 2 phrases:

De plus, les fausses déclarations peuvent être causées par l'application de règles incorrectes ou par une connaissance insuffisante du test statistique. Par exemple, l'df totale dans un ANOVA peut être considéré comme le df d'erreur dans le rapport d'un test, ou le chercheur peut diviser la valeur de p rapporté d'un χ 2 ou F test en deux, afin d'obtenir un à flancs p valeur, tandis que la p valeur d'un χ 2 ou F test est déjà un test unilatéral.Fχ2Fppχ2F

Pourquoi ont-ils pu dire cela? Le test du khi-carré est un test à deux faces. (J'ai demandé à l'un des auteurs, mais je n'ai pas eu de réponse.)

Est-ce que je néglige quelque chose?

Joel W.
la source
Regardez l'exercice 4.14 de l'édition 2004 de «Econometric Theory and Methods» de Davidson & Mackinnon pour un exemple (exceptionnel) de l'utilisation du chi carré pour un test bilatéral. Edit: excellente explication ici: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Max

Réponses:

50

Le test du khi-carré est essentiellement toujours un test unilatéral . Voici une façon vague de penser à cela: le test du khi-carré est fondamentalement un test de «qualité de l'ajustement». Parfois, il est explicitement désigné comme tel, mais même si ce n’est pas le cas, il s’agit toujours essentiellement d’un avantage. Par exemple, le test d’indépendance du chi-carré sur une table de fréquences 2 x 2 est (en quelque sorte) un test de validité de l’ajustement de la première ligne (colonne) à la distribution spécifiée par la deuxième ligne (colonne), et inversement , simultanément. Ainsi, lorsque la valeur khi-deux réalisée est dépassée dans la partie droite de sa distribution, elle indique un mauvais ajustement et, si elle est suffisamment éloignée, par rapport à un seuil prédéfini, nous pourrions conclure qu'elle est si faible que nous ne croyons pas que les données proviennent de cette distribution de référence.

Si nous utilisions le test du chi-carré comme test bilatéral, nous serions également inquiets si les statistiques étaient trop éloignées du côté gauche de la distribution du chi-carré. Cela voudrait dire que nous craignons que l'ajustement ne soit trop bon . Ce n’est tout simplement pas quelque chose qui nous inquiète généralement. (En tant que note historique, cela est lié à la controverse de savoir si Mendel a falsifié ses données. L'idée était que ses données étaient trop belles pour être vraies. Voir ici pour plus d'informations si vous êtes curieux.)

gung - Rétablir Monica
la source
9
+1 pour avoir mentionné l'utilisation à double sens des expériences de pois de Mendel: elle est mémorable et va au cœur de la question.
whuber
2
+1 pour une bonne question et une excellente réponse. @Joel W: Je vous recommande fortement Khan Academys vidéo sur le Testχ2
Max Gordon
9
Mon résumé est que le est un test bilatéral dont nous sommes habituellement intéressés par une seule des queues de la distribution, ce qui indique plus de désaccord, plutôt que moins de désaccord que l' on attend par hasard. χ2
Frank Harrell
5
Prise en charge de la vue bilatérale: "La probabilité bilatérale supérieure à +/- z pour la distribution normale standard est égale à la probabilité extrême droite au-dessus de z au carré pour la distribution khi-carré avec df = 1. Par exemple, la la probabilité normale standard à queue de 0,05 qui tombe en dessous de -1,96 et au-dessus de 1,96 est égale à la probabilité khi-carré droite au-dessus de (1,96) carré = 3,84 lorsque df = 1. " Agresti, 2007 (2e éd.) Page 11
Joel W.
5
C'est vrai. La quadrature d'un z-score donne une variable khi-carré. Par exemple, un z de 2 (ou -2!) Lorsque carré équivaut à 4, la valeur khi-carré correspondante. La valeur p bilatérale associée à un z-score de 2 est 0,04550026; et la valeur p unilatérale associée à une valeur khi-carré de 4 (df = 1) est 0,04550026. Un test z bilatéral correspond à un test chi-carré unilatéral. Regarder la queue gauche de la distribution chi-carré correspondrait à la recherche de scores z plus proches de z = 0 que ce à quoi vous pourriez vous attendre par hasard.
Gay - Rétablir Monica
12

Le chi-carré est-il toujours un test unilatéral?

Cela dépend vraiment de deux choses:

  1. (OE)2E

  2. π1π2|T||T|

Autrement dit, nous devons faire très attention à ce que nous entendons par «test du chi-carré» et préciser ce que nous entendons par «unilatéral» ou «bilatéral».

Dans certaines circonstances (deux que j'ai mentionnées; il y en a peut-être davantage), il peut sembler judicieux de l'appeler bilatéral, ou il peut être raisonnable de l'appeler bilatéral si vous acceptez le flou de l'utilisation de la terminologie.

Il peut être raisonnable de dire que ce n’est jamais unilatéral que si vous limitez la discussion à des types particuliers de tests du khi-deux.

Glen_b
la source
qu'en est-il de celui-ci? stats.stackexchange.com/questions/223560/…
Un vieil homme à la mer.
Merci beaucoup d'avoir mentionné le test de variance. C’est en fait une utilisation assez intéressante du test, et aussi la raison pour laquelle j’ai fini sur cette page ^^
Tobbey
5

(n1)s2/σ2σ2(mμ)n/sμ

Ray Koopman
la source
1

χ2

χ2

Cette lecture serait confondre la manière dont la statistique de test a été générée avec laquelle les queues de la statistique de test sont examinées.

des conjectures
la source
Pourriez-vous préciser ce que serait un "côté d'une distribution originale"? On ne voit même pas à quoi cette "distribution d'origine" se réfère, ni comment elle est liée à la statistique du khi-carré calculée à partir de données.
whuber
nχ2χ2
OK, mais je ne peux toujours pas comprendre avec quoi vous opposez cela. Pourriez-vous donner un exemple de statistique de test non bilatérale qui pourrait être utilisée dans ANOVA et montrer comment elle est liée aux queues d'une distribution?
whuber
χ2χ2χ2
Je demande un contraste uniquement pour aider à comprendre ce que vous essayez de décrire. Je n'ai pas encore pu déterminer ce que c'était.
whuber
0

J'ai aussi eu du mal à comprendre cette question, mais après quelques expériences, j'ai eu l'impression que mon problème résidait simplement dans la façon dont les tests sont nommés.

Dans SPSS, par exemple, une table 2x2 peut être complétée par un test chisquare. Il y a deux colonnes pour les valeurs p, une pour "Pearson Chi-Sqare", "Correction de continuité", etc., et une autre paire de colonnes pour le test exact de Fisher où il y a une colonne pour un test bilatéral et Test unilatéral.

J'ai d'abord pensé que les versions à 1 et 2 faces désignaient une version à 1 ou 2 faces du test chisquare, ce qui semblait étrange. Il s’est toutefois avéré que cela dénote la formulation sous-jacente de l’hypothèse alternative dans le test de la différence entre les proportions, c’est-à-dire le test z. Ainsi, le test bilatéral des proportions souvent raisonnable est réalisé dans SPSS avec le test chisquare, dans lequel la mesure chisquare est comparée à une valeur située dans la partie supérieure (unilatérale) de la distribution. J'imagine que c'est ce que d'autres réponses à la question initiale ont déjà souligné, mais il m'a fallu un certain temps pour m'en rendre compte.

À propos, le même type de formulation est utilisé dans openepi.com et éventuellement dans d’autres systèmes.

Robert L
la source
0

χ2 (n1)s2σ2σs>σs<σsσ

shahuss
la source
1
Bienvenue sur CV! Je pense que la réponse de Ray Koopman couvre déjà ce point.
Silverfish
-1

χ2χ2χ2

SSwdfw

χ2

Distributions Chi-deux et F

Daniel
la source
1
Une statistique de test n'a pas besoin de prendre des valeurs négatives pour que nous puissions considérer les deux queues. Considérons un test F pour le rapport de deux variances, par exemple.
Glen_b
Le test F est un test unilatéral Glen_b.
Daniel
3
Le test F d'égalité des variances, qui contient une statistique selon laquelle le rapport entre les deux estimations de variance n'est PAS unilatéral; Il existe une approximation qui place la plus grande variance de l'échantillon sur le numérateur, mais ce n'est vraiment vrai que si les df sont identiques. Mais si vous n'aimez pas cela, vous trouverez un certain nombre d'autres exemples. La statistique pour le test de la somme des rangs ne peut pas être négative, mais le test est à deux queues. Je peux fournir d'autres exemples si nécessaire.
Glen_b
σ12σ22σ12>σ22