Une valeur de p est la probabilité d'obtenir une statistique au moins aussi extrême que celle observée dans les données d'échantillon en supposant que l'hypothèse nulle ( ) est vraie.
Graphiquement, cela correspond à l'aire définie par la statistique de l'échantillon sous la distribution d'échantillonnage que l'on obtiendrait en supposant :
Cependant, parce que la forme de cette distribution supposée est en fait basée sur les données de l'échantillon, le centrer sur me semble un choix étrange.
Si l'on devait plutôt utiliser la distribution d'échantillonnage de la statistique, c'est-à-dire centrer la distribution sur la statistique de l'échantillon, alors le test d'hypothèse correspondrait à l'estimation de la probabilité de compte tenu des échantillons.
Dans ce cas, la valeur de p est la probabilité d'obtenir une statistique au moins aussi extrême que compte tenu des données au lieu de la définition ci-dessus.
De plus, une telle interprétation a l'avantage de bien correspondre au concept d'intervalles de confiance:
un test d'hypothèse avec un niveau de signification équivaudrait à vérifier si situe dans l' intervalle de confiance de la distribution d'échantillonnage.
Je pense donc que centrer la distribution sur pourrait être une complication inutile.
Y a-t-il des justifications importantes pour cette étape que je n'ai pas considérées?
Réponses:
Supposons que est un échantillon tiré d'une distribution normale avec une moyenne inconnue et une variance connue . L'échantillon moyen est donc normal avec la moyenne et la variance . Sur ce point, je pense qu'il ne peut y avoir aucune possibilité de désaccord.X= (X1,X2, … ,Xn) μ σ2 X¯ μ σ2/ n
Maintenant, vous proposez que notre statistique de test soit Droite? MAIS CE N'EST PAS UNE STATISTIQUE . Pourquoi? Parce que est un paramètre inconnu . Une statistique est une fonction de l'échantillon qui ne dépend d'aucun paramètre inconnu. Par conséquent, une hypothèse doit être faite à propos de pour que soit une statistique. Une telle hypothèse consiste à écrire sous lequel qui est une statistique.
En revanche, vous proposez d'utiliser lui-même. Dans ce cas, identique, et ce n'est même pas une variable aléatoire, encore moins distribuée normalement. Il n'y a rien à tester.μ =X¯ Z= 0
la source
Ce n'est en fait pas vrai. La forme de cette distribution supposée vient de l'acceptation de comme vrai.H0
L'échantillon n'est pas directement impliqué dans cela, sauf par certaines hypothèses.Utiliser directement l'échantillon n'est pas suffisant. Vous avez également besoin de l'hypothèse nulle pour tenir.La question est: comment estimez-vous la probabilité de quelque chose que vous supposez être vrai. Dans notre cas, si vous supposez que est vrai, il est vain d'essayer d'estimer la probabilité que soit vrai.H0 H0
Vous n'avez pas deux distributions là-bas, il n'y en a qu'une, celle supposée être votre vérité fondamentale, alias celle qui vient avec . Il existe cependant une distribution d'échantillonnage dérivée de l'échantillon, mais celle-ci n'est pas impliquée dans les hypothèses que vous utilisez.H0
Un bon exercice serait d'essayer de reproduire la même logique avec une distribution asymétrique. Prenez la distribution du chi carré comme dans le test d'indépendance du chi carré. Pouvez-vous le reproduire? Je pense que la réponse est non.
la source
D'après ce que je comprends, vous soutenez qu'il est plus logique de «retourner» et .H0 H1
Je trouve utile de considérer le test d'hypothèse comme une preuve par contradiction. Nous supposons que est vrai, puis montrons que les preuves indiquent qu'une telle hypothèse est erronée, justifiant ainsi le rejet de en faveur de .H0 H0 H1
Cela fonctionne parce que lorsque nous supposonsH0 et centrer notre distribution là-bas, nous pouvons déterminer la probabilité / improbabilité de notre observation. Par exemple, siH0: μ = 0 contre. H1: μ ≠ 0 et nous déterminons à partir de nos tests qu'il y a moins de 5% de chances que la vraie moyenne μ est en fait égal à 0, nous pouvons rejeter H0 avec une confiance de 95%.
L'inverse n'est pas nécessairement vrai. Disons que nous faisons une expérience et déterminons qu'il y a en fait 30% de chances que l'hypothèse nulle soit toujours valable. Nous ne pouvons pas rejeter la nullité, mais nous ne l’acceptons pas non plus . Cette situation ne montre pas queH0 (le nul) est vrai, mais que nous n'avons pas les preuves pour prouver qu'il est faux.
Imaginez maintenant si nous renversions cette situation. Disons que nous supposonsH1 et constater que, compte tenu de nos résultats, la probabilité de H0 est de 5% ou moins, qu'est-ce que cela signifie? Bien sûr, nous pouvons rejeter le nul, mais pouvons-nous nécessairement accepterH1 ? Il est difficile de justifier l'acceptation de ce que nous pensions être vrai au début.
Montrant celaH0 est faux n'est pas le résultat que nous recherchons; nous voulons plaider en faveur deH1 . En faisant le test de la manière que vous décrivez, nous montrons que nous n'avons pas de preuves pour dire queH1 est faux, ce qui est subtilement différent de l'argument H1 est vrai.
la source