Je lis le livre de Larry Wasserman, All of Statistics , et actuellement sur les valeurs de p (page 187). Permettez-moi d'abord de présenter quelques définitions (je cite):
Définition 1 La fonction de puissance d'un test avec une région de rejet est définie par La taille d'un test est définie comme Un test est dit de niveau \ alpha si sa taille est inférieure ou égale à \ alpha .
Cela signifie essentiellement que , la taille est la "plus grande" probabilité d'une erreur de type I. La valeur est alors définie via (je cite)
Définition 2 Supposons que pour chaque nous avons un test de taille avec la région de rejet . Ensuite,
où .
Pour moi, cela signifie: étant donné un \ alpha spécifique, il existe une région de test et de rejet afin que . Pour la valeur je prends simplement le plus petit de tous ces .
Question 1 Si tel était le cas, alors je pourrais clairement choisir pour arbitrairement petit . Quelle est ma mauvaise interprétation de la définition 2, c'est-à-dire que signifie-t-elle exactement?
Maintenant Wasserman continue et énonce un théorème pour avoir une définition "équivalente" de la valeur de que je connais (je cite):
Théorème Supposons que le test de taille soit de la forme Ensuite, où est la valeur observée de .
Voici donc ma deuxième question:
Question 2 Comment puis-je réellement prouver ce théorème? C'est peut-être dû à ma mauvaise compréhension de la définition de la valeur , mais je ne peux pas le comprendre.
Réponses:
Nous avons quelques données multivariées , tirées d'une distribution avec un paramètre inconnu . Notez que sont des exemples de résultats.D θ xx D θ x
Nous voulons tester une hypothèse sur un paramètre inconnu , les valeurs de sous l'hypothèse nulle sont dans l'ensemble .θ θ 0θ θ θ0
Dans l'espace du , on peut définir une région de rejet , et la puissance de cette région est alors définie comme . Donc, la puissance est calculée pour une valeur particulière de comme la probabilité que le résultat de l'échantillon soit dans la région de rejet lorsque la valeur de est . Évidemment, la puissance dépend de la région et de la choisie .R R P R ˉ θ = P ˉ θ ( x ∈ R ) ˉ θ θ x R θ ˉ θ R ˉ θX R R PRθ¯= Pθ¯( x ∈ R ) θ¯ θ X R θ θ¯ R θ¯
La définition 1 définit la taille de la régionR comme le supremum de toutes les valeurs de pour dans , donc uniquement pour les valeurs de sous . Il est évident que cela dépend de la région, donc . ˉ θ θ 0 ˉ θ H 0 α R = s u p ˉ θ ∈ θ 0 P R ˉ θPRθ¯ θ¯ θ0 θ¯ H0 αR=supθ¯∈θ0PRθ¯
Comme dépend de nous avons une autre valeur lorsque la région change, et ceci est la base pour définir la valeur p: changez la région, mais de telle manière que la valeur observée de l'échantillon appartient toujours à la région, pour chacune de ces régions, calculer le tel que défini ci - dessus et de prendre la borne inférieure: . La valeur de p est donc la plus petite taille de toutes les régions contenant . R α R p v ( x ) = i n f R | x ∈ R α R xαR R αR pv(x)=infR|x∈RαR x
Le théorème n'est alors qu'une «traduction» de celui-ci, à savoir le cas où les régions sont définies à l'aide d'une statistique et pour une valeur vous définissez une région comme . Si vous utilisez ce type de région dans le raisonnement ci-dessus, le théorème suit.T c R R = { x | T ( x ) ≥ c } RR T c R R={x|T(x)≥c} R
MODIFIER en raison des commentaires:
@ user8: pour le théorème; si vous définissez des régions de rejet comme dans le théorème, alors une région de rejet de taille est un ensemble qui ressemble à pour certains .R α = { X | T ( X ) ≥ c α } c αα Rα={X|T(X)≥cα} cα
Pour trouver la valeur de p d'une valeur observée , c'est-à-dire vous devez trouver la plus petite région , c'est-à-dire la plus grande valeur de telle que contient toujours , ce dernier (la région contient ) équivaut (en raison de la façon dont les régions sont définies) à dire que , donc vous devez trouver le plus grand tel quep v ( x ) R c { X | T ( X ) ≥ c } x x c ≥ T ( x ) c { X | T ( X ) ≥ c & c ≥ T ( x ) }x pv(x) R c {X|T(X)≥c} x x c≥T(x) c {X|T(X)≥c&c≥T(x)}
De toute évidence, le plus grand tel que devrait être , puis l'ensemble ci-dessus devientc ≥ T ( x ) c = T ( x ) { X | T ( X ) ≥ c = T ( x ) } = { X | T ( X ) ≥ T ( x ) }c c≥T(x) c=T(x) {X|T(X)≥c=T(x)}={X|T(X)≥T(x)}
la source
Dans la définition 2, la valeur d'une statistique de test est la plus grande borne inférieure de tous les sorte que l'hypothèse est rejetée pour un test de taille . Rappelons que plus nous faisons , moins nous tolérons les erreurs de type I, donc la région de rejet diminuera également. Donc (très) de manière informelle, la valeur est le plus petit nous puissions choisir, ce qui nous permet toujours de rejeter pour les données que nous avons observées. Nous ne pouvons pas choisir arbitrairement un plus petit car à un moment donné,α α α R α p α H 0 α R αp α α α Rα p α H0 α Rα sera si petit qu'il exclura (c'est-à-dire qu'il ne contiendra pas) l'événement que nous avons observé.
Maintenant, à la lumière de ce qui précède, je vous invite à reconsidérer le théorème.
la source