Quelle est la différence entre les scores Z et les valeurs p?

11

Dans les algorithmes de motif de réseau, il semble assez courant de renvoyer à la fois une valeur p et un score Z pour une statistique: "Le réseau d'entrée contient X copies du sous-graphique G". Un sous-graphique est considéré comme un motif s'il satisfait

  • valeur p <A,
  • Score Z> B et
  • X> C, pour certains A, B et C définis par l'utilisateur (ou définis par la communauté)

Cela motive la question:

Question : Quelles sont les différences entre la valeur p et le score Z?

Et la sous-question:

Question : Y a-t-il des situations où la valeur de p et le score Z de la même statistique pourraient suggérer des hypothèses opposées? Les première et deuxième conditions énumérées ci-dessus sont-elles essentiellement les mêmes?

Douglas S. Stones
la source

Réponses:

9

Je dirais, sur la base de votre question, qu'il n'y a pas de différence entre les trois tests. C'est en ce sens que vous pouvez toujours choisir A, B et C de telle sorte que la même décision soit prise quel que soit le critère que vous utilisez. Bien que vous ayez besoin que la valeur de p soit basée sur la même statistique (c'est-à-dire le score Z)

Pour utiliser le score Z, la moyenne et la variance sont supposées être connues et la distribution est supposée normale (ou asymptotiquement / approximativement normale). Supposons que le critère de valeur p soit le 5% habituel. Ensuite nous avons:μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

Nous avons donc le triple qui représentent tous les mêmes seuils.(0.05,1.645,μ+1.645σ)

Notez que la même correspondance s'appliquera au test t, bien que les nombres soient différents. Le test des deux queues aura également une correspondance similaire, mais avec des nombres différents.

probabilitéislogique
la source
Merci pour ça! (et merci aussi aux autres répondeurs).
Douglas S. Stones
8

Un score décrit votre écart par rapport à la moyenne en unités d'écart type. Il n'est pas explicite si vous acceptez ou rejetez votre hypothèse nulle.Z

Une valeur est la probabilité que, dans l'hypothèse nulle, nous puissions observer un point aussi extrême que votre statistique. Cela vous indique explicitement si vous rejetez ou acceptez votre hypothèse nulle étant donné une taille de test .pα

Prenons un exemple où et l'hypothèse nulle est . Ensuite, vous observez . Votre score est 5 (ce qui ne vous indique que dans quelle mesure vous vous écartez de votre hypothèse nulle en termes de ) et votre valeur est 5,733e-7. Pour une confiance de 95%, vous aurez une taille de test et puisque vous rejetterez l'hypothèse nulle. Mais pour toute statistique donnée, il devrait y avoir des équivalents et tels que les tests soient les mêmes.XN(μ,1)μ=0x1=5Zσpα=0.05p<αAB

Gary
la source
3
@Gary - une valeur de p ne vous dit pas de rejeter ou pas plus qu'un Z-score. Ce ne sont que des chiffres. Seule la règle de décision détermine l'acceptation ou le rejet. Cette règle de décision pourrait tout aussi bien être définie en termes de score Z (par exemple, la règle ou )2σ3σ
probabilitéislogique
@probabilityislogic Je suis d'accord avec vous. En effet, vous pouvez construire un test basé sur le seuil de score mais cela ne vous permet pas de définir explicitement une taille de test au sens classique (c'est-à-dire en termes de probabilité). Ce type de critères peut être problématique si votre distribution a des queues épaisses. Lorsque vous construisez un test, vous définissez explicitement une taille de test et donc la valeur vous indique immédiatement si vous acceptez ou refusez, ce que j'essayais de faire valoir. Zp
Gary
@gary - pas vraiment, car la valeur p ne fait aucune référence aux alternatives. Il ne peut donc pas être utilisé pour comparer directement des alternatives. Par exemple, prenez vs . La valeur de p pour reste la même . Vous dites donc "rejeter le null" qui signifie "accepter l'alternative" et déclarer . Mais c'est absurde, personne ne le ferait, mais la règle de valeur p que vous utilisez ici le fait. Autrement dit, la règle de la valeur de p que vous avez décrite n'est pas invariante par rapport à ce qu'on appelle l '"hypothèse nulle" (résolution à venir)H0:μ=0HA:μ=1H05×107μ=1
probabilitéislogique
(suite) La résolution de l'absurdité apparente est à noter que la valeur de p n'est pas un test "absolu", mais un test relatif, défini avec une hypothèse alternative implicite. Dans ce cas, l'alternative implicite est . Vous pouvez le constater en notant que si je calcule la valeur de p de j'obtiens , ce qui est plus petit que la valeur de p pour . Or, dans cet exemple, «l'alternative implicite» est facile à trouver par intuition, mais elle est beaucoup plus difficile à trouver dans des problèmes plus complexes, où les paramètres de nuisance ou pas de statistiques suffisantes. H A 1 × 10 - 9 H 0Himp:μ=5HA1×109H0
probabilitéislogic
1
@Gary - la valeur p n'est pas plus rigoureuse simplement parce que c'est une probabilité. Il s'agit d'une transformation monotone de 1 à 1 du score Z. toute "rigueur" qui est possédée par la valeur de p est également possédée par le Z-score. Bien que si vous utilisez un test bilatéral, l'équivalent est la valeur absolue du score Z. Et pour comparer au nul, vous devez adopter une approche "minimax": qui est de choisir l'hypothèse forte qui est la plus supportée par les données et cohérente avec . À moins que vous ne puissiez démontrer comment calculerH 1 P ( X | μ 1 )H1:μ0H1P(X|μ1)
probabilité
6

zp indique à quel point la statistique est improbable. -score indique à quelle distance de la moyenne il est. Il peut y avoir une différence entre eux, selon la taille de l'échantillon.z

Pour les grands échantillons, même de petits écarts par rapport à la moyenne deviennent peu probables. C'est-à-dire que la valeur peut être très petite même pour un faible score . Inversement, pour de petits échantillons, même des écarts importants ne sont pas improbables. C'est-à-dire qu'un grand score ne signifie pas nécessairement une petite valeur .z z ppzzp

Sheldon Cooper
la source
si la taille de l'échantillon est grande, alors l'écart-type sera faible, donc le score Z sera élevé. Je pense que vous découvrirez cela si vous essayez un exemple numérique.
probabilitéislogic
1
Pas vraiment. Supposons que vous échantillonniez à partir de N (0, 1). Votre std sera alors d'environ 1 quelle que soit la taille de l'échantillon. Ce qui diminuera, c'est l'erreur-type de la moyenne, et non l'écart-type. Les valeurs de p sont basées sur SEM, pas sur std.
SheldonCooper
Le score Z est (moyenne observée) / (écart-type). Mais la moyenne et l'écart-type sont de la statistique observée, pas de la population dont les composantes ont été tirées. Ma terminologie lâche a été prise ici. Cependant, si vous testez la moyenne, l'écart type approprié dans le score Z est l'erreur standard, qui diminue au même rythme que la valeur p.
probabilitéislogic