Un article publié ( pdf ) contient ces 2 phrases:
De plus, les fausses déclarations peuvent être causées par l'application de règles incorrectes ou par une connaissance insuffisante du test statistique. Par exemple, l'df totale dans un ANOVA peut être considéré comme le df d'erreur dans le rapport d'un test, ou le chercheur peut diviser la valeur de p rapporté d'un χ 2 ou F test en deux, afin d'obtenir un à flancs p valeur, tandis que la p valeur d'un χ 2 ou F test est déjà un test unilatéral.
Pourquoi ont-ils pu dire cela? Le test du khi-carré est un test à deux faces. (J'ai demandé à l'un des auteurs, mais je n'ai pas eu de réponse.)
Est-ce que je néglige quelque chose?
hypothesis-testing
chi-squared
Joel W.
la source
la source
Réponses:
Le test du khi-carré est essentiellement toujours un test unilatéral . Voici une façon vague de penser à cela: le test du khi-carré est fondamentalement un test de «qualité de l'ajustement». Parfois, il est explicitement désigné comme tel, mais même si ce n’est pas le cas, il s’agit toujours essentiellement d’un avantage. Par exemple, le test d’indépendance du chi-carré sur une table de fréquences 2 x 2 est (en quelque sorte) un test de validité de l’ajustement de la première ligne (colonne) à la distribution spécifiée par la deuxième ligne (colonne), et inversement , simultanément. Ainsi, lorsque la valeur khi-deux réalisée est dépassée dans la partie droite de sa distribution, elle indique un mauvais ajustement et, si elle est suffisamment éloignée, par rapport à un seuil prédéfini, nous pourrions conclure qu'elle est si faible que nous ne croyons pas que les données proviennent de cette distribution de référence.
Si nous utilisions le test du chi-carré comme test bilatéral, nous serions également inquiets si les statistiques étaient trop éloignées du côté gauche de la distribution du chi-carré. Cela voudrait dire que nous craignons que l'ajustement ne soit trop bon . Ce n’est tout simplement pas quelque chose qui nous inquiète généralement. (En tant que note historique, cela est lié à la controverse de savoir si Mendel a falsifié ses données. L'idée était que ses données étaient trop belles pour être vraies. Voir ici pour plus d'informations si vous êtes curieux.)
la source
Cela dépend vraiment de deux choses:
Autrement dit, nous devons faire très attention à ce que nous entendons par «test du chi-carré» et préciser ce que nous entendons par «unilatéral» ou «bilatéral».
Dans certaines circonstances (deux que j'ai mentionnées; il y en a peut-être davantage), il peut sembler judicieux de l'appeler bilatéral, ou il peut être raisonnable de l'appeler bilatéral si vous acceptez le flou de l'utilisation de la terminologie.
Il peut être raisonnable de dire que ce n’est jamais unilatéral que si vous limitez la discussion à des types particuliers de tests du khi-deux.
la source
la source
Cette lecture serait confondre la manière dont la statistique de test a été générée avec laquelle les queues de la statistique de test sont examinées.
la source
J'ai aussi eu du mal à comprendre cette question, mais après quelques expériences, j'ai eu l'impression que mon problème résidait simplement dans la façon dont les tests sont nommés.
Dans SPSS, par exemple, une table 2x2 peut être complétée par un test chisquare. Il y a deux colonnes pour les valeurs p, une pour "Pearson Chi-Sqare", "Correction de continuité", etc., et une autre paire de colonnes pour le test exact de Fisher où il y a une colonne pour un test bilatéral et Test unilatéral.
J'ai d'abord pensé que les versions à 1 et 2 faces désignaient une version à 1 ou 2 faces du test chisquare, ce qui semblait étrange. Il s’est toutefois avéré que cela dénote la formulation sous-jacente de l’hypothèse alternative dans le test de la différence entre les proportions, c’est-à-dire le test z. Ainsi, le test bilatéral des proportions souvent raisonnable est réalisé dans SPSS avec le test chisquare, dans lequel la mesure chisquare est comparée à une valeur située dans la partie supérieure (unilatérale) de la distribution. J'imagine que c'est ce que d'autres réponses à la question initiale ont déjà souligné, mais il m'a fallu un certain temps pour m'en rendre compte.
À propos, le même type de formulation est utilisé dans openepi.com et éventuellement dans d’autres systèmes.
la source
la source
la source