On m'a appris que nous pouvons produire une estimation de paramètre sous la forme d'un intervalle de confiance après échantillonnage à partir d'une population. Par exemple, des intervalles de confiance à 95%, sans hypothèse non respectée, devraient avoir un taux de réussite de 95% pour contenir quel que soit le véritable paramètre que nous estimons être dans la population.
C'est à dire,
- Produisez une estimation ponctuelle à partir d'un échantillon.
- Produisez une plage de valeurs qui a théoriquement 95% de chances de contenir la vraie valeur que nous essayons d'estimer.
Cependant, lorsque le sujet est devenu un test d'hypothèse, les étapes ont été décrites comme suit:
- Supposons un paramètre comme hypothèse nulle.
- Produire une distribution de probabilité de la probabilité d'obtenir diverses estimations ponctuelles étant donné que cette hypothèse nulle est vraie.
- Rejeter l'hypothèse nulle si l'estimation ponctuelle que nous obtenons serait produite moins de 5% du temps si l'hypothèse nulle est vraie.
Ma question est la suivante:
Est-il nécessaire de produire nos intervalles de confiance en utilisant l'hypothèse nulle pour rejeter le nul? Pourquoi ne pas simplement faire la première procédure et obtenir notre estimation du vrai paramètre (sans utiliser explicitement notre valeur hypothétique dans le calcul de l'intervalle de confiance), puis rejeter l'hypothèse nulle si elle ne tombe pas dans cet intervalle?
Cela me semble logiquement équivalent intuitivement, mais je crains de manquer quelque chose de très fondamental car il y a probablement une raison pour laquelle il est enseigné de cette façon.
Réponses:
Un problème simple, à titre d'exemple, est donné en testant la moyenne d'une population normale avec une variance connue . Ensuite, un pivot - une quantité dont la distribution ne dépend pas du paramètre, est donné par . Les valeurs critiques satisfont, dans ce cas symétrique, et .ˉ Y - μ ∼ N ( 0 , 1 / n ) z α / 2 Φ ( - z α / 2 ) = α /σ2= 1 Oui¯- μ ∼ N( 0 , 1 / n ) zα / 2 Φ ( z α / 2 ) = 1 - α / 2Φ ( - zα / 2) = α / 2 Φ ( zα / 2) = 1 - α / 2
Par conséquent, sorte que est un intervalle de confiance de niveau .(ˉX-zα/2/√
En même temps, l'événement en première ligne de l'affichage est précisément aussi l'événement où l'hypothèse nulle n'est pas rejetée pour ce . Puisque le reste contient juste des reformulations équivalentes, le ci contient en effet tous les pour lesquels le null n'est pas rejeté, et aucune référence à "sous le null" n'est nécessaire.μμ μ
Voici un graphique analogue à la visualisation +1 de Martijn visant à montrer ce que l'on appelle la dualité entre les intervalles de confiance et les tests. désigne l'intervalle de confiance appartenant à certains et la région d'acceptation appartenant à une hypothèse .ˉ x ∗ A ( μ 0 ) μ = μ 0C X¯∗ A ( μ0) μ = μ0
la source
Oui, vous pouvez remplacer un test d'hypothèse (comparer l'échantillon à une distribution hypothétique des résultats du test) par une comparaison avec un intervalle de confiance calculé à partir de l'échantillon. Mais indirectement, un intervalle de confiance est déjà une sorte de test d'hypothèse, à savoir:
La conséquence de faire une telle plage est que la plage échoue seulement une fraction du temps.α
Exemple
J'utilise une image d'une réponse à la question ci-dessous: Intervalles de confiance: comment traiter formellementP( L ( X ) ≤ θ , U( X ) ≥ θ ) = 1 - α
Il s'agit d'une variation d'un graphique de Clopper-Pearson . Imaginez le cas de 100 Bernoulli où la probabilité de succès est et nous observons le nombre total de succès .Xθ X
Notez que:
Dans le sens vertical, vous voyez des tests d'hypothèse. Par exemple, pour une valeur hypothétique donnée vous rejetez l'hypothèse si le mesuré est au-dessus ou au-dessous des lignes pointillées rouges ou vertes.Xθ X
Dans le sens horizontal, vous voyez les intervalles de confiance de Clopper-Pearson. Si pour une observation donnée X vous utilisez ces intervalles de confiance, vous vous tromperez seulement 5% du temps
(parce que vous n'observerez qu'un tel X, sur lequel vous basez un «mauvais» intervalle, 5% du temps)
la source