Pendant mes études pour mon cours de statistiques, j'essayais de comprendre la différence entre les tests d'hypothèse unilatéraux et bilatéraux. Plus précisément, pourquoi le test unilatéral rejette-t-il le nul alors que celui bilatéral ne le fait pas?
Un exemple:
hypothesis-testing
Lu Ci
la source
la source
Réponses:
Un test bilatéral teste une différence dans les deux sens. Ainsi, la valeur P serait l'aire sous la distribution t à droite de t = 1,92 PLUS l'aire sous la distribution à gauche de t = -1,92. C'est deux fois plus de surface que le test unilatéral et la valeur P est donc deux fois plus grande.
Si vous utilisez un test unilatéral, vous gagnez en puissance, mais au prix potentiel d'avoir à ignorer une différence qui est dans la direction opposée à celle supposée avant l'obtention des données. Si vous avez obtenu les données avant de formaliser et d'enregistrer l'hypothèse, vous devriez vraiment utiliser un test bilatéral. De même, si vous êtes intéressé par un effet dans l'une ou l'autre direction, utilisez un test bilatéral. En fait, vous souhaiterez peut-être utiliser un test bilatéral comme approche par défaut et n'utiliser un test unilatéral que dans le cas inhabituel où un effet ne peut exister que dans une seule direction.
la source
L'aire sous la courbe n'est pas deux fois plus grande pour un test bilatéral: pour un test bilatéral avec p = 0,05 critique, vous testez la fréquence à laquelle les données observées pourraient être tirées de 2,5% inférieur ou supérieur d'une distribution nulle ( 0,05 au total). Avec un test unilatéral, vous testez la fréquence à laquelle les données proviendraient de la queue extrême de 5% d'une queue (pré-spécifiée).
En partie, la réponse à votre question est une question de pratique: la plupart des chercheurs considèrent que les expériences rapportant des tests unilatéraux sont peu susceptibles de se reproduire (c'est-à-dire qu'ils supposent que le chercheur a choisi cela pour que leurs statistiques soient "significatives").
Il existe cependant des cas d'utilisation valables. Si vous savez que tout résultat en sens inverse est impossible dans le cadre de la théorie testée, alors, comme indiqué dans un commentaire précédent, vous pouvez le spécifier à l'avance et effectuer un test unilatéral. La plupart des gens, encore une fois, considéreraient cela avec circonspection.
la source
Cela conduit à la question: pourquoi utiliser des statistiques de test différentes? La raison en est que les alternatives sont différentes et donc la puissance de chaque statistique de test est différente. Plus précisément, la puissance de chaque test est réduite (à condition d'utiliser la même signification) si nous utilisons la statistique de test et la région de rejet de l'autre test.
la source