valeur p comme distance?

8

Les valeurs de p entre plusieurs tests par paire peuvent-elles être considérées comme une mesure de similitude / distance et une mise à l'échelle multidimensionnelle peut-elle être appliquée sur une matrice de paires de valeurs de p pour réduire la dimensionnalité? C'est une question douce, mais quel serait le plus gros problème ici, et comment pourrait-on mieux le surmonter? (ex: inégalité triangulaire?)

qlinck
la source
2
Ma réponse courte à votre première question sur la "distance de similitude" serait Non, vous pouvez vous référer à une question similaire sur un sujet différent ici: stats.stackexchange.com/questions/32890/… . Ces messages suggèrent donc d'autres mesures de «divergence» ou de distance. Je suppose qu'il vaut mieux d'abord répondre à votre première question.
JDav

Réponses:

3

Si toutes les "vraies distances" sont égales à 0, alors les valeurs de p suivront une distribution uniforme et ne seront que des distances aléatoires et incorrectes.
Si les distances réelles ne sont pas égales à 0, vous avez toujours des problèmes d'échelle où une statistique de test peut être plus significative. Les valeurs p de 0,9 et 0,6 ne sont pas très différentes dans l'interprétation tandis que les valeurs p de 0,06 et 0,01 sont assez différentes dans l'interprétation, mais les algorithmes mds mettraient plus de distance entre les premiers que les derniers. Vous devriez également considérer la puissance, vous pouvez avoir 2 groupes qui ont une très petite distance entre eux, mais de grandes tailles d'échantillon, donc vous obtenez une petite valeur de p; puis une autre paire avec une grande différence entre eux, mais en raison de la petite taille de l'échantillon (faible puissance), vous obtenez une valeur p plus grande.

Greg Snow
la source
2

Je crois que la réponse est oui.

On pourrait penser à la "similitude" entre deux variables à mesurer par (disons) corrélation. Et pour que la valeur de p soit la signification de la corrélation différente de 0. Dans un tel cas, une petite valeur de p (proche de zéro) est celle qui reflète une grande distance ("différence") entre les variables.

Vous pouvez transformer les valeurs de p en scores z (où leur "distance" devra prendre la direction "habituelle"), et voir si les méthodes que vous avez mentionnées auront un sens à cet égard ...

Tal Galili
la source
1

Je ne sais pas ce que vous entendez par "valeurs p entre plusieurs tests par paire". La valeur de p est une mesure de la probabilité / improbabilité d'un test particulier de voir une valeur comme extrême ou plus extrême que ce qui a été réellement observé si l'hypothèse nulle est vraie. Lors d'un test par paire, il n'y a pas de connexion particulière entre une valeur p et une autre. Je ne vois pas comment des valeurs de p pourraient être considérées comme une mesure de similitude entre les tests par paires.

Michael R. Chernick
la source