Peut-on rejeter une hypothèse nulle avec des intervalles de confiance produits par échantillonnage plutôt que l'hypothèse nulle?

9

On m'a appris que nous pouvons produire une estimation de paramètre sous la forme d'un intervalle de confiance après échantillonnage à partir d'une population. Par exemple, des intervalles de confiance à 95%, sans hypothèse non respectée, devraient avoir un taux de réussite de 95% pour contenir quel que soit le véritable paramètre que nous estimons être dans la population.

C'est à dire,

  1. Produisez une estimation ponctuelle à partir d'un échantillon.
  2. Produisez une plage de valeurs qui a théoriquement 95% de chances de contenir la vraie valeur que nous essayons d'estimer.

Cependant, lorsque le sujet est devenu un test d'hypothèse, les étapes ont été décrites comme suit:

  1. Supposons un paramètre comme hypothèse nulle.
  2. Produire une distribution de probabilité de la probabilité d'obtenir diverses estimations ponctuelles étant donné que cette hypothèse nulle est vraie.
  3. Rejeter l'hypothèse nulle si l'estimation ponctuelle que nous obtenons serait produite moins de 5% du temps si l'hypothèse nulle est vraie.

Ma question est la suivante:

Est-il nécessaire de produire nos intervalles de confiance en utilisant l'hypothèse nulle pour rejeter le nul? Pourquoi ne pas simplement faire la première procédure et obtenir notre estimation du vrai paramètre (sans utiliser explicitement notre valeur hypothétique dans le calcul de l'intervalle de confiance), puis rejeter l'hypothèse nulle si elle ne tombe pas dans cet intervalle?

Cela me semble logiquement équivalent intuitivement, mais je crains de manquer quelque chose de très fondamental car il y a probablement une raison pour laquelle il est enseigné de cette façon.

Nikli
la source
Je m'excuse de ne pas avoir été clair, Martijn. Je vais modifier mon message sous peu afin qu'il soit plus clair pour les personnes qui chercheront les mêmes questions à l'avenir. Ce que je voulais dire, c'est que nous pouvons calculer une estimation de paramètre à partir d'un échantillon, ou nous pouvons calculer une plage d'estimations que nous considérerions comme supportant l'hypothèse nulle en utilisant l'hypothèse nulle. Je ne comprenais pas pourquoi il était nécessaire d'utiliser le nul pour voir si notre estimation ponctuelle était dans cet intervalle, plutôt que d'utiliser simplement notre estimation de paramètre et de vérifier si le nul était dans les limites de l'estimation de paramètre. J'espère que cela à du sens!
Nikli
Une expérience de pensée intéressante est si quelqu'un essaie de vous vendre des dés pondérés. Ils les roulent, puis déclarent qu'ils sont pondérés dans la direction que vous observez (par exemple 6 apparaît 20% du temps). Sont-ils pondérés (si suffisamment de lancers d'échantillons ont été effectués), de combien, et que vaut-il la peine de faire vos propres tests de lancer de dés (supplémentaires)? Le vendeur et l'acheteur ont des objectifs différents ...
Philip Oakley

Réponses:

5

Un problème simple, à titre d'exemple, est donné en testant la moyenne d'une population normale avec une variance connue . Ensuite, un pivot - une quantité dont la distribution ne dépend pas du paramètre, est donné par . Les valeurs critiques satisfont, dans ce cas symétrique, et .ˉ Y - μ N ( 0 , 1 / n ) z α / 2 Φ ( - z α / 2 ) = α /σ2=1Y¯μN(0,1/n)zα/2Φ ( z α / 2 ) = 1 - α / 2Φ(zα/2)=α/2Φ(zα/2)=1α/2

Par conséquent, sorte que est un intervalle de confiance de niveau .(ˉX-zα/2/

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
1-α
(X¯zα/2/n,X¯+zα/2/n)
1α

En même temps, l'événement en première ligne de l'affichage est précisément aussi l'événement où l'hypothèse nulle n'est pas rejetée pour ce . Puisque le reste contient juste des reformulations équivalentes, le ci contient en effet tous les pour lesquels le null n'est pas rejeté, et aucune référence à "sous le null" n'est nécessaire.μμμ

Voici un graphique analogue à la visualisation +1 de Martijn visant à montrer ce que l'on appelle la dualité entre les intervalles de confiance et les tests. désigne l'intervalle de confiance appartenant à certains et la région d'acceptation appartenant à une hypothèse .ˉ x A ( μ 0 ) μ = μ 0Cx¯A(μ0)μ=μ0

entrez la description de l'image ici

Christoph Hanck
la source
10

Oui, vous pouvez remplacer un test d'hypothèse (comparer l'échantillon à une distribution hypothétique des résultats du test) par une comparaison avec un intervalle de confiance calculé à partir de l'échantillon. Mais indirectement, un intervalle de confiance est déjà une sorte de test d'hypothèse, à savoir:

  • Vous pouvez voir les intervalles de confiance comme étant construits comme une plage de valeurs pour lesquelles un test d'hypothèse de niveau réussiraitα et en dehors de la plage un test d'hypothèse de niveau échouerait.α

La conséquence de faire une telle plage est que la plage échoue seulement une fraction du temps.α

Exemple

J'utilise une image d'une réponse à la question ci-dessous: Intervalles de confiance: comment traiter formellementP(L(X)θ,U(X)θ)=1-α

Il s'agit d'une variation d'un graphique de Clopper-Pearson . Imaginez le cas de 100 Bernoulli où la probabilité de succès est et nous observons le nombre total de succès .XθX

probabilité fiduciale

Notez que:

  • Dans le sens vertical, vous voyez des tests d'hypothèse. Par exemple, pour une valeur hypothétique donnée vous rejetez l'hypothèse si le mesuré est au-dessus ou au-dessous des lignes pointillées rouges ou vertes.XθX

  • Dans le sens horizontal, vous voyez les intervalles de confiance de Clopper-Pearson. Si pour une observation donnée X vous utilisez ces intervalles de confiance, vous vous tromperez seulement 5% du temps

    (parce que vous n'observerez qu'un tel X, sur lequel vous basez un «mauvais» intervalle, 5% du temps)

Sextus Empiricus
la source