Les valeurs de p entre plusieurs tests par paire peuvent-elles être considérées comme une mesure de similitude / distance et une mise à l'échelle multidimensionnelle peut-elle être appliquée sur une matrice de paires de valeurs de p pour réduire la dimensionnalité? C'est une question douce, mais quel serait le plus gros problème ici, et comment pourrait-on mieux le surmonter? (ex: inégalité triangulaire?)
8
Réponses:
Un cas spécifique, où les valeurs de p sont générées à partir de tests sur des tables de fréquences, a été utilisé comme similitudes et une mise à l'échelle multidimensionnelle a été appliquée dans cet article: http://www.biomedcentral.com/content/pdf/1748-7188 -1-10.pdfχ2
la source
Si toutes les "vraies distances" sont égales à 0, alors les valeurs de p suivront une distribution uniforme et ne seront que des distances aléatoires et incorrectes.
Si les distances réelles ne sont pas égales à 0, vous avez toujours des problèmes d'échelle où une statistique de test peut être plus significative. Les valeurs p de 0,9 et 0,6 ne sont pas très différentes dans l'interprétation tandis que les valeurs p de 0,06 et 0,01 sont assez différentes dans l'interprétation, mais les algorithmes mds mettraient plus de distance entre les premiers que les derniers. Vous devriez également considérer la puissance, vous pouvez avoir 2 groupes qui ont une très petite distance entre eux, mais de grandes tailles d'échantillon, donc vous obtenez une petite valeur de p; puis une autre paire avec une grande différence entre eux, mais en raison de la petite taille de l'échantillon (faible puissance), vous obtenez une valeur p plus grande.
la source
Je crois que la réponse est oui.
On pourrait penser à la "similitude" entre deux variables à mesurer par (disons) corrélation. Et pour que la valeur de p soit la signification de la corrélation différente de 0. Dans un tel cas, une petite valeur de p (proche de zéro) est celle qui reflète une grande distance ("différence") entre les variables.
Vous pouvez transformer les valeurs de p en scores z (où leur "distance" devra prendre la direction "habituelle"), et voir si les méthodes que vous avez mentionnées auront un sens à cet égard ...
la source
Je ne sais pas ce que vous entendez par "valeurs p entre plusieurs tests par paire". La valeur de p est une mesure de la probabilité / improbabilité d'un test particulier de voir une valeur comme extrême ou plus extrême que ce qui a été réellement observé si l'hypothèse nulle est vraie. Lors d'un test par paire, il n'y a pas de connexion particulière entre une valeur p et une autre. Je ne vois pas comment des valeurs de p pourraient être considérées comme une mesure de similitude entre les tests par paires.
la source