Différence entre les tests unilatéraux et bilatéraux?

Pendant mes études pour mon cours de statistiques, j'essayais de comprendre la différence entre les tests d'hypothèse unilatéraux et bilatéraux. Plus précisément, pourquoi le test unilatéral rejette-t-il le nul alors que celui bilatéral ne le fait pas?

Un exemple:

la différence entre les tests d'hypothèse unilatéraux et bilatéraux

hypothesis-testing Lu Ci
la source

Notez que vous refusez uniquement à un niveau de signification spécifié. Vous pouvez toujours rejeter les deux hypothèses en augmentant le niveau de signification à 10%. vous échoueriez également à rejeter les deux si vous abaissiez le niveau de signification à 1%.

probabilitéislogic

Réponses:

Un test bilatéral teste une différence dans les deux sens. Ainsi, la valeur P serait l'aire sous la distribution t à droite de t = 1,92 PLUS l'aire sous la distribution à gauche de t = -1,92. C'est deux fois plus de surface que le test unilatéral et la valeur P est donc deux fois plus grande.

Si vous utilisez un test unilatéral, vous gagnez en puissance, mais au prix potentiel d'avoir à ignorer une différence qui est dans la direction opposée à celle supposée avant l'obtention des données. Si vous avez obtenu les données avant de formaliser et d'enregistrer l'hypothèse, vous devriez vraiment utiliser un test bilatéral. De même, si vous êtes intéressé par un effet dans l'une ou l'autre direction, utilisez un test bilatéral. En fait, vous souhaiterez peut-être utiliser un test bilatéral comme approche par défaut et n'utiliser un test unilatéral que dans le cas inhabituel où un effet ne peut exister que dans une seule direction.

Michael Lew
la source

Merci pour ton commentaire, Michael. Voici ce que je ne comprends pas: comment l'aire sous la courbe peut-elle être deux fois plus grande pour le test bilatéral? P ne devrait-il pas être le même dans les deux cas, puisque alpha = 0,05?

Lu Ci

alpha, dans votre question, est juste votre limite pour prendre une décision sur ce que p-signifie (rejeter null ou non). Donc, cela n'influence pas la valeur de p.

John

Un peu pointilleux, mais l'idée que vous devez choisir l'hypothèse avant de voir les données n'est pas nécessaire. Vous pouvez effectuer deux tests unilatéraux. Vous rejetterez toujours la direction non privilégiée par les données. Il est donc logique de suivre le test unilatéral qui est favorisé par les données.

probabilitéislogique

@probabilityislogic -Je suis entièrement d'accord, sauf lorsque l'on veut que la valeur alpha reflète le taux d'erreur faux positif réel à long terme (c'est-à-dire que l'on veut utiliser l'approche de Neyman-Pearson). Si vous utilisez un test unilatéral et décidez de la direction du changement à tester sur la base de l'effet observé, vous obtenez exactement deux fois plus de faux positifs que votre niveau alpha impliquerait.

Michael Lew

Ce n'est que le taux d'erreur à long terme pour quelqu'un qui continue d'ignorer les données précédentes. Ce n'est pas un bon moyen d'obtenir de bonnes performances à long terme. le taux d'erreur donné par la signification est sur tous les ensembles de données que nous aurions pu observer une fois .

probabilités

L'aire sous la courbe n'est pas deux fois plus grande pour un test bilatéral: pour un test bilatéral avec p = 0,05 critique, vous testez la fréquence à laquelle les données observées pourraient être tirées de 2,5% inférieur ou supérieur d'une distribution nulle ( 0,05 au total). Avec un test unilatéral, vous testez la fréquence à laquelle les données proviendraient de la queue extrême de 5% d'une queue (pré-spécifiée).

En partie, la réponse à votre question est une question de pratique: la plupart des chercheurs considèrent que les expériences rapportant des tests unilatéraux sont peu susceptibles de se reproduire (c'est-à-dire qu'ils supposent que le chercheur a choisi cela pour que leurs statistiques soient "significatives").

Il existe cependant des cas d'utilisation valables. Si vous savez que tout résultat en sens inverse est impossible dans le cadre de la théorie testée, alors, comme indiqué dans un commentaire précédent, vous pouvez le spécifier à l'avance et effectuer un test unilatéral. La plupart des gens, encore une fois, considéreraient cela avec circonspection.

Tim
la source

$S(D)$ $RR$

$S(D)=|t|$ $|t|>t_{0}$ $t_{0}$ $\alpha$ $S(D)=t$ $t>t_{1}$ $t_{1}$ $Pr(|t|>t_{0}|H_{0})\geq Pr(t>t_{0}|H_{0})$ $t_{0}\geq t_{1}$ .

Cela conduit à la question: pourquoi utiliser des statistiques de test différentes? La raison en est que les alternatives sont différentes et donc la puissance de chaque statistique de test est différente. Plus précisément, la puissance de chaque test est réduite (à condition d'utiliser la même signification) si nous utilisons la statistique de test et la région de rejet de l'autre test.

probabilitéislogique
la source