Justification du test d'hypothèse unilatéral

35

Je comprends les tests d’hypothèses bilatéraux. Vous avez (vs ). La est la probabilité que génère des données au moins aussi extrêmes que celles observées. $H_0 : \theta = \theta_0$ $H_1 = \neg H_0 : \theta \ne \theta_0$ $p$ $\theta$

Je ne comprends pas les tests d'hypothèses unilatéraux. Ici, $H_0 : \theta\le\theta_0$ (vs $H_1 = \neg H_0 : \theta > \theta_0$ ). La définition de p-value ne devrait pas avoir changé depuis le haut: cela devrait toujours être la probabilité que $\theta$ génère des données au moins aussi extrêmes que celles observées. Mais nous ne savons pas $\theta$ , seulement que sa limite supérieure est $\theta_0$ .

Donc, au lieu de cela, je vois des textes qui nous disent de supposer que $\theta = \theta_0$ (et non pas de $\theta \le \theta_0$ selon $H_0$ ) et calcule la probabilité que cela génère des données au moins aussi extrêmes que ce qui a été observé, mais seulement à une extrémité . Cela semble n'avoir rien à voir avec les hypothèses, techniquement.

Maintenant, je comprends que ce sont des tests d’hypothèses fréquentistes et que les fréquentistes ne placent aucun prieur sur leur $\theta$ s. Mais cela ne devrait-il pas simplement signifier que les hypothèses sont alors impossibles à accepter ou à rejeter, plutôt que de mettre en place le calcul ci-dessus dans l’image?

hypothesis-testing Yang
la source

Une question similaire a ensuite été posée. Stats.stackexchange.com/questions/8196/…

robin girard

1

Votre définition de la est incomplète. Il faut lire (non souligné dans l'original): La est la probabilité que génère des données au moins aussi extrêmes que ce qui a été observé, en supposant que l'hypothèse nulle soit vraie .

p

$p$

p

$p$

θ

$\theta$

Alexis

34

C'est une question réfléchie. De nombreux textes (peut-être pour des raisons pédagogiques) traitent de cette question. Ce qui se passe réellement, c'est que est une "hypothèse" composite dans votre situation unilatérale: c'est en fait un ensemble d'hypothèses, pas une seule. Il faut que pour toutes les hypothèses possibles en $H_0$ $H_0$ , le risque que la statistique de test tombe dans la région critique doit être inférieur ou égal à la taille de l’essai. De plus, si le test doit réellement atteindre sa taille nominale (ce qui est une bonne chose pour atteindre une puissance élevée), alors la plus grande part de ces chances (prise en charge de toutes les hypothèses nulles) doit être égale à la taille nominale. En pratique, pour de simples tests de localisation à un paramètre impliquant certaines "belles" familles de distributions, ce supremum est atteint pour l'hypothèse avec le paramètre . Ainsi, dans la pratique, tous les calculs se concentrent sur cette distribution. Mais il ne faut pas oublier le reste de la série $\theta_0$ $H_0$ : c’est une distinction cruciale entre les tests bilatéraux et unilatéraux (et entre les tests "simples" et "composites" en général).

Cela influence subtilement l'interprétation des résultats des tests unilatéraux. Lorsque la valeur null est rejetée, nous pouvons dire que les éléments de preuve contre le véritable état de la nature sont l’une des distributions de . Lorsque la valeur null n'est pas rejetée, nous pouvons simplement dire qu'il existe une distribution dans qui est "cohérente" avec les données observées. Nous ne disons pas que toutes les distributions dans sont cohérentes avec les données: loin de là! Beaucoup d'entre eux peuvent produire des probabilités extrêmement faibles. $H_0$ $H_0$ $H_0$

whuber
la source

Tout ce que vous avez dit est valable et important. Je pense qu'un autre aspect important est que l'hypothèse nulle est généralement considérée comme une hypothèse sans intérêt. L'alternative est considérée comme une hypothèse scientifique. C'est celui que l'expérimentateur voudrait prouver. Je dis habituellement parce que c'est différent dans les tests d'équivalence et de non infériorité. Maintenant, en ce qui concerne la question des tests unilatéraux, il suffit de dire que le côté qui a un paramètre supérieur à la valeur nulle qui est intéressante. Ainsi, toutes les valeurs du côté inférieur à sont incorporées dans le zéro.

Michael R. Chernick

stats.stackexchange.com/questions/333301/… Si vous avez envie de répondre à cette question ou de m'indiquer une bibliographie ...;)

Un vieil homme à la mer.

6

Je vois la comme la probabilité maximale d'une erreur de type I. Si , la probabilité d'un taux d'erreur de type I peut être effectivement nulle, mais qu'il en soit ainsi. En examinant le test du point de vue du minimax, un adversaire ne tirerait jamais du fond de «l'intérieur» de l'hypothèse nulle, et le pouvoir ne devrait pas être affecté. Pour des situations simples (le test , par exemple), il est possible de construire un test avec un taux maximum garanti de type I, permettant de telles hypothèses nulles unilatérales. $p$ $\theta \ll \theta_0$ $t$

shabbychef
la source

2

Vous utiliseriez un test d'hypothèse unilatéral si seuls les résultats dans une direction corroborent la conclusion à laquelle vous tentez d'arriver.

Pensez-y à la question que vous posez. Supposons, par exemple, que vous souhaitiez savoir si l'obésité entraîne un risque accru de crise cardiaque. Vous collectez vos données, qui peuvent comprendre 10 personnes obèses et 10 personnes non obèses. Supposons maintenant que, en raison de facteurs de confusion non enregistrés, d'une conception expérimentale médiocre ou simplement de la malchance, vous remarquiez que seulement 2 des 10 personnes obèses ont une crise cardiaque, contre 8 des non-obèses.

Maintenant, si vous deviez effectuer un test d’hypothèse bilatéral sur ces données, vous concluriez qu’il existait une association statistiquement significative (p ~ 0,02) entre l’obésité et le risque de crise cardiaque. Cependant, l’association irait dans le sens opposé à celui auquel vous vous attendiez, le résultat du test serait donc trompeur.

(Dans la réalité, une expérience produisant un résultat aussi intuitif pourrait donner lieu à d’autres questions intéressantes en soi: par exemple, le processus de collecte de données pourrait devoir être amélioré, ou des facteurs de risque inconnus au travail pourraient exister, ou peut-être que la sagesse conventionnelle est tout simplement erronée, mais ces questions ne sont pas vraiment liées à la question étroite de savoir quel type de test d'hypothèse utiliser.

Hong Ooi
la source

2

$p$ $H_0$ $H_0$ $0.5$ $H_1$ $0.5$

$H_0$ $H_0$ $0.75$ $H_1$ $0.25$

$H_1$ 's happen nevertheless their probabilities are the p-values under the condition that the respective $H_0$ 's are true - as noted above. So depending on your confidence level you can or cannot reject your $H_0$ 's.

You can experiment with this toy example in R yourself, you should also try different absolute numbers and combinations of heads and tails:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1

vonjd
la source

Justification du test d'hypothèse unilatéral

Réponses: