Les hypothèses nulles et alternatives doivent-elles être exhaustives ou non?

27

J'ai vu beaucoup de fois affirmer qu'ils devaient être exhaustifs (les exemples dans de tels livres étaient toujours définis de telle manière, qu'ils l'étaient en effet), d'autre part, j'ai également vu beaucoup de fois des livres indiquant qu'ils devraient être exclusifs ( par exemple as and as ) sans clarifier le problème exhaustif. Ce n'est qu'avant de taper cette question que j'ai trouvé une déclaration un peu plus forte sur la page Wikipédia - "L'alternative n'est pas nécessairement la négation logique de l'hypothèse nulle".H0μ1=μ2H1μ1>μ2

Quelqu'un de plus expérimenté pourrait-il expliquer ce qui est vrai, et je serais reconnaissant de faire la lumière sur les raisons (historiques?) De cette différence (les livres ont été écrits par des statisticiens après tout, c'est-à-dire des scientifiques, pas des philosophes).

greenoldman
la source

Réponses:

14

En principe, il n'y a aucune raison pour que les hypothèses soient exhaustives. Si le test concerne un paramètre avec étant la restriction , l'alternative peut être de n'importe quelle forme tant queθH0θΘ0HaθΘa

Θ0Θa=.

Un exemple expliquant pourquoi l'exhaustivité n'a pas beaucoup de sens est en comparant deux familles de modèles, contre . Dans un tel cas, l'exhaustivité est impossible, car l'alternative devrait alors couvrir tous les modèles de probabilité possibles.H0: xf0(x|θ0)Ha: xf1(x|θ1)

Xi'an
la source
1
Merci, savez-vous par hasard pourquoi il est si courant de voir cette exigence d'exhaustivité? Mis à part un simple malentendu, car ce serait l'un des malentendus les plus courants :-).
greenoldman
3
Je ne comprends pas l'exemple. Lorsque vous comparez deux familles de modèles et elles semblent épuiser tous les modèles possibles de la famille. Si vous autorisez le nul et l'alternative à ne pas couvrir tous ces modèles, vous compliquez le processus d'évaluation du risque théorique de décision du test (à la fois en théorie et en pratique). H0Ha
whuber
2
@whuber: vous avez mal lu mon exemple. Comme écrit ci-dessus, l'alternative est constituée d'une famille de modèles bien définie, où s'étend sur l'ensemble des valeurs possibles, plutôt que d' être composé de tous les modèles de probabilité possibles. Ceci n'est donc pas exhaustif. Il s'agit d'une critique adressée à l'approche bayésienne des tests, voir par exemple la philosophe des sciences, Deborah Mayo, dans Error and InferenceHaθ1
Xi'an
2
Je pense que je lis correctement votre exemple, Xi'an, mais il est clair que je lutte avec ce que vous entendez par «exhaustif». Son utilisation dans votre réponse et vos commentaires semble signifier «inclut toutes les distributions de probabilité», mais dans la plupart des situations de test d'hypothèse, cela n'est pas pertinent. Dans la situation actuelle, «exhaustif» doit signifier «comprenant toutes les distributions incluses dans le modèle» (comme toutes les distributions normales pour un test de théorie normale).
whuber
15

La principale raison pour laquelle vous voyez l'exigence que les hypothèses soient exhaustives est le problème de ce qui se passe si la vraie valeur du paramètre se trouve dans la région qui n'est couverte ni par l'hypothèse nulle ni par l'hypothèse alternative. Ensuite, le test au niveau de confiance devient vide de sens, ou, pire encore, votre test sera biaisé en faveur de la valeur nulle - par exemple, un test unilatéral de la forme vs , alors qu'en fait . αθ=0θ>0θ<0

Un exemple: un test unilatéral pour vs partir d'une distribution normale avec connu et vrai . Avec un échantillon de 100, un test à 95% rejetterait si , mais 0,1645 est en fait 2,645 écarts-types au-dessus de la moyenne réelle, conduisant à un niveau de test réel d'environ 99,6%.μ=0μ>0σ=1μ=0.1x¯>0.1645

De plus, vous excluez la possibilité d'être surpris et d'apprendre quelque chose d'intéressant.

Cependant, on peut également le considérer comme définissant l'espace des paramètres comme un sous-ensemble de ce qui pourrait généralement être considéré comme l'espace des paramètres, par exemple, la moyenne d'une distribution normale est souvent considérée comme se situant quelque part sur la ligne réelle, mais si nous le faisons un test unilatéral, nous définissons en effet l'espace des paramètres comme étant la partie de la ligne couverte par le zéro et l'alternative.

jbowman
la source
Merci, vous vous êtes cependant trompé de libellé, non exclusif mais exhaustif (première ligne).
greenoldman
12
Conceptuellement, un test unilatéral est vraiment un test sous la forme vs plutôt que vs . Dans les expositions élémentaires, en particulier celles vues sur le Web, cette distinction est passée sous silence, mais elle est soigneusement et correctement gérée dans la littérature statistique et les bons manuels. Ainsi, nous ne restreignons pas l'espace des paramètres. H0:θ0HA:θ>0H0:θ=0HA:θ>0
whuber
2
whuber - vous avez raison sur le test unilatéral, bien sûr. J'essayais, bien que de façon inepte, de décrire ce qui pourrait arriver si les hypothèses n'étaient pas en fait exhaustives, ce qui dans ce cas se produirait si le nul était . Si nous voulons vraiment nous en tenir au point nul et à l'alternative unilatérale, et avoir des hypothèses exhaustives, il me semble que nous devons redéfinir l'espace des paramètres comme ci-dessus. θ=0
jbowman
2
Vraiment @whuber? L'hypothèse nulle dans un test unilatéral est une inégalité qui inclut la queue non testée? Cela a tellement plus de sens pour moi! Mais comme vous le dites, il a été présenté dans mon cours comme une égalité de points. Merci pour la clarification.
James