Lorsque l '"hypothèse nulle" comprend plus d'un état de la nature, le taux de faux positifs réel (FPR) peut varier avec cet état. Tout ce que nous pouvons faire est de garantir une limite sur le FPR quel que soit cet état de nature - mais nous ne pouvons pas toujours garantir que le FPR est réellement égal à α .
(Il existe d'autres raisons pour lesquelles le FPR pourrait ne pas être réellement égal à sa valeur cible , comme lorsque la statistique de test est discrète. Ces situations peuvent généralement être corrigées en utilisant des procédures de décision randomisées. En tant que telles, elles ne fournissent aucun aperçu fondamental question.)α
Considérons le test unilatéral classique où la statistique est supposée avoir une distribution normale de moyenne inconnue et (pour simplifier) l'écart type connu . doit être comparé à . L'hypothèse nulle est tandis que l'hypothèse alternative est . La région de rejet est donc de la formeXμσμ0H0:μ≥0HA:μ<0
R(α)=(−∞,Zα]
où est choisi pour que la chance d'observer une statistique dans cette région soit au maximum :Zα α
α=sup(Pr(X∈R(α))).(1)
Sous les hypothèses, cette probabilité est donnée par la fonction de distribution normale :Φ
Pr(X∈R(α))=Φ(Zα−μσ).(2)
Cette probabilité dépend de la valeur inconnue de . μ Par conséquent, nous ne pouvons pas garantir qu'il est réellement égal à . En effet, pour les grands , est pratiquement nul. Nous devons cependant couvrir toutes nos bases et garantir que tant que est cohérent avec l'hypothèse nulle, le taux de faux positifs ne dépassera pas . αμ(2)μ(1)α
C'est un problème sournois. Si vous disposez de données continues et que vous les traitez de manière appropriée, alors . Cependant, lorsque vos données sont discrètes, il peut ne pas être possible pour . Considérez les données binomiales pour savoir si une pièce est juste, avec 5 flips de pièces, les valeurs p unilatérales possibles sont:Pr(p≤α|H0)=α p=α
Seules têtes peuvent produire une erreur de type I, et la probabilité associée à cette erreur est . Ainsi, le taux d'erreur de type I serait maintenu à "au plus ", mais pas égal à .0 ≈0.03 α α
D'un autre côté, il existe des stratégies d'analyse (invalides) qui conduisent à des taux d'erreur de type I supérieurs à , même lorsque (par exemple, des routines de sélection pas à pas).α p<α
J'ai une discussion plus approfondie ici: comparaison et contraste, valeurs de p, niveaux de signification et erreur de type I
la source