Tout en dérivant formellement l'intervalle de confiance d'une estimation, je me suis retrouvé avec une formule qui ressemble de très près à la façon dont la valeur de est calculée.
D'où la question: sont-ils formellement équivalents? Ie rejette une hypothèse avec une valeur critique équivalente à n'appartenant pas à l'intervalle de confiance avec une valeur critique ?
hypothesis-testing
confidence-interval
p-value
Jorge Leitao
la source
la source
Réponses:
Oui et non.
D'abord le "oui"
Ce que vous avez observé, c'est que lorsqu'un test et un intervalle de confiance sont basés sur la même statistique, il y a une équivalence entre eux: on peut interpréter la valeur comme la plus petite valeur de α pour laquelle la valeur nulle du paramètre serait être inclus dans l' intervalle de confiance 1 - α .p α 1−α
Soit un paramètre inconnu dans l'espace des paramètres Θ ⊆ R , et que l'échantillon x = ( x 1 , … , x n ) ∈ X n ⊆ R n soit une réalisation de la variable aléatoire X = ( X 1 , … , X n ) . Pour simplifier, définir un intervalle de confiance I α ( X ) comme un intervalle aléatoire tel que sa probabilité de couverture P θθ Θ⊆R x=(x1,…,xn)∈Xn⊆Rn X=(X1,…,Xn) Iα(X)
(Vous pouvez également considérer des intervalles plus généraux, où la probabilité de couverture est limitée par ou approximativement égale à 1 - α . Le raisonnement est analogue.)
Considérons un test bilatéral de l'hypothèse ponctuelle nulle contre l'alternative H 1 ( θ 0 ) : θ ≠ θ 0 . Soit λ ( θ 0 , x ) la valeur de p du test. Pour tout α ∈ ( 0 , 1 ) , H 0 ( θ 0 ) est rejeté au niveau α siH0(θ0):θ=θ0 H1(θ0):θ≠θ0 λ(θ0,x) α∈(0,1) H0(θ0) α . Larégion de rejet deniveau α est l'ensemble de x qui conduit au rejet de H 0 ( θ 0 ) :
R α ( θ 0 ) = { x ∈ R n : λ ( θ 0 , x ) ≤ α } .λ(θ0,x)≤α α x H0(θ0)
Considérons maintenant une famille de tests bilatéraux avec des valeurs de p , pour θ ∈ Θ . Pour une telle famille, nous pouvons définir une région de rejet inversée Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ(θ,x) θ∈Θ
Pour tout fixe , H 0 ( θ 0 ) est rejeté si x ∈ R α ( θ 0 ) , ce qui se produit si et seulement si θ 0 ∈ Q α ( x ) , c'est-à-dire x ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) . Si le test est basé sur une statistique de test avec une distribution nulle absolument continue complètement spécifiée, alorsθ0 H0(θ0) x∈Rα(θ0) θ0∈Qα(x)
(Une grande partie de cela est tirée de ma thèse de doctorat .)
Maintenant pour le "non"
Ce phénomène est lié à des problèmes liés à l'imbrication de tels intervalles, ce qui signifie que l'intervalle de 94% peut être plus court que l'intervalle de 95%. Pour en savoir plus à ce sujet, voir la section 2.5 de mon récent article (à paraître dans Bernoulli).
Et un deuxième "non"
Et parfois "oui" n'est pas une bonne chose
Comme l'a souligné f coppens dans un commentaire, les intervalles et les tests ont parfois des objectifs quelque peu contradictoires. Nous voulons des intervalles courts et des tests avec une puissance élevée, mais l'intervalle le plus court ne correspond pas toujours au test avec la puissance la plus élevée. Pour quelques exemples de cela, voir cet article (distribution normale multivariée), ou ceci (distribution exponentielle), ou la section 4 de ma thèse .
Les Bayésiens peuvent aussi dire oui et non
Il y a quelques années, j'ai posé ici une question sur la question de savoir si une équivalence d'intervalle de test existe également dans les statistiques bayésiennes. La réponse courte est qu'en utilisant le test d'hypothèse bayésienne standard, la réponse est "non". En reformulant un peu le problème des tests, la réponse peut cependant être «oui». (Mes tentatives pour répondre à ma propre question se sont finalement transformées en papier !)
la source
la source