Dans les algorithmes de motif de réseau, il semble assez courant de renvoyer à la fois une valeur p et un score Z pour une statistique: "Le réseau d'entrée contient X copies du sous-graphique G". Un sous-graphique est considéré comme un motif s'il satisfait
- valeur p <A,
- Score Z> B et
- X> C, pour certains A, B et C définis par l'utilisateur (ou définis par la communauté)
Cela motive la question:
Question : Quelles sont les différences entre la valeur p et le score Z?
Et la sous-question:
Question : Y a-t-il des situations où la valeur de p et le score Z de la même statistique pourraient suggérer des hypothèses opposées? Les première et deuxième conditions énumérées ci-dessus sont-elles essentiellement les mêmes?
la source
Un score décrit votre écart par rapport à la moyenne en unités d'écart type. Il n'est pas explicite si vous acceptez ou rejetez votre hypothèse nulle.Z
Une valeur est la probabilité que, dans l'hypothèse nulle, nous puissions observer un point aussi extrême que votre statistique. Cela vous indique explicitement si vous rejetez ou acceptez votre hypothèse nulle étant donné une taille de test .p α
Prenons un exemple où et l'hypothèse nulle est . Ensuite, vous observez . Votre score est 5 (ce qui ne vous indique que dans quelle mesure vous vous écartez de votre hypothèse nulle en termes de ) et votre valeur est 5,733e-7. Pour une confiance de 95%, vous aurez une taille de test et puisque vous rejetterez l'hypothèse nulle. Mais pour toute statistique donnée, il devrait y avoir des équivalents et tels que les tests soient les mêmes.X∼N(μ,1) μ=0 x1=5 Z σ p α=0.05 p<α A B
la source
zp indique à quel point la statistique est improbable. -score indique à quelle distance de la moyenne il est. Il peut y avoir une différence entre eux, selon la taille de l'échantillon.z
Pour les grands échantillons, même de petits écarts par rapport à la moyenne deviennent peu probables. C'est-à-dire que la valeur peut être très petite même pour un faible score . Inversement, pour de petits échantillons, même des écarts importants ne sont pas improbables. C'est-à-dire qu'un grand score ne signifie pas nécessairement une petite valeur .z z pp z z p
la source