En lisant le livre All of Statistics de Wassermann, je remarque une subtilité fine dans la définition des valeurs de p, que je ne peux pas comprendre. De manière informelle, le Wassermann définit la valeur de p comme
[..] la probabilité (sous ) d'observer une valeur de la statistique de test identique ou plus extrême que ce qui a été réellement observé.
Je souligne. Le même plus formellement (Théorème 10.12):
Supposons que le test de taille soit de la forme
rejeter si et seulement si T ( X n ) ≥ c α .
Puis,
où est la valeur observée de X n . Si Θ 0 = { θ 0 } alors p -value = P θ 0 [ T ( X n ) ≥ T ( x n ) ]
De plus, Wassermann définit la valeur de p du test de Pearson (et d'autres tests de façon analogue) comme:
chisq.test
Réponses:
"As or more extreme" est correct.
Formellement, alors, si la distribution est telle que la probabilité d'obtenir la statistique de test elle-même est positive, cette probabilité (et tout ce qui est également extrême, comme la valeur correspondante dans l'autre queue) doit être incluse dans la valeur de p.
la source
la source