Contrôle de santé mentale: à quel point une valeur de p peut-elle descendre?

24

J'utilise un test de ranksum pour comparer la médiane de deux échantillons ( ) et ont constaté qu'ils sont très différents avec: . Dois-je me méfier d'une si petite valeur ou dois-je l'attribuer à la puissance statistique élevée associée à la présence d'un très grand échantillon? Existe-t-il une valeur étrangement basse ?n=120000p = 1.12E-207pp

N26
la source
Il s'agit presque d'un doublon de stats.stackexchange.com/questions/78839 .
amibe dit Réintégrer Monica

Réponses:

30

Les valeurs de p sur les ordinateurs standard (utilisant des flotteurs à double précision IEEE) peuvent descendre jusqu'à environ . Ces calculs peuvent être légitimement corrects lorsque les tailles d'effet sont grandes et / ou que les erreurs standard sont faibles. Votre valeur, si elle est calculée avec une distribution T ou normale, correspond à une taille d'effet d'environ 31 erreurs standard. N'oubliez pas que les erreurs standard sont généralement mises à l'échelle avec la racine carrée réciproque de , ce qui reflète une différence de moins de 0,09 écart type (en supposant que tous les échantillons sont indépendants). Dans la plupart des applications, une telle différence n'aurait rien de suspect ou d'inhabituel. ndix-303n

L'interprétation de ces valeurs p est une autre affaire. Voir un nombre aussi petit que ou même comme probabilité dépasse les limites de la raison, étant donné toutes les manières dont la réalité est susceptible de s'écarter du modèle de probabilité qui sous-tend ce p- calcul de la valeur. Un bon choix consiste à signaler la valeur de p comme étant inférieure au plus petit seuil que le modèle peut raisonnablement prendre en charge: souvent entre et . 10 - 10 0,01 0,0001dix-207dix-dix0,010,0001

whuber
la source
13
Quand j'ai signalé '' '' dans un document de conférence, un critique m'a dit que je devrais le changer en '' p < 0,001 '' afin de suivre les directives de l'APA. p<dix-26p<0,001
Thomas Levine
4
@whuber - Magnifiquement déclaré.
rolando2
2
(+1) À un moment donné, il est plus probable que le gouvernement retourne à distance des bits dans votre RAM avec la technologie super espion ...
JMS
4
(+1) Vous pouvez en fait descendre juste en dessous de en virgule flottante double précision IEEE. Mais, vos routines numériques pour le calcul des valeurs de p sont presque garanties de s'effondrer avant cela. À moins que vous ne sachiez avec certitude que vos hypothèses de modélisation sont parfaitement correctes (et quand le sont-elles?), Une valeur p ne devient finalement qu'une mesure de la taille de l'échantillon une fois que l'échantillon est suffisamment grand. 5×dix-324pp
cardinal
1
@Cardinal nous sommes tous les deux tort sur les limites: en dehors des valeurs dénormalisées, l' IEEE le plus petit à double est d' environ , correspondant aux bits dix pour un exposant de base 2. dix-308
whuber
16

Il n'y a rien de suspect - des valeurs de p extrêmement faibles comme la vôtre sont assez courantes lorsque la taille des échantillons est grande (comme la vôtre pour comparer les médianes). Comme indiqué plus haut, ces valeurs de p sont normalement signalées comme étant inférieures à un certain seuil (par exemple <0,001).

Une chose à laquelle il faut faire attention est que les valeurs de p vous indiquent uniquement si la différence de médiane est statistiquement significative. Vous devrez décider si la différence est suffisamment importante: par exemple, pour de grands ensembles d'échantillons, de très petites différences de moyennes / médianes peuvent être statistiquement significatives, mais cela peut ne pas signifier beaucoup.

xuexue
la source
3

Une valeur de p peut atteindre une valeur de 0.

θH0:θ=1X=1.1

AdamO
la source