Quelle est la différence entre wilcox.test et coin :: wilcox_test dans R?

13

Ces deux fonctions existent dans R mais je ne connais pas leurs différences. Il semble qu'ils ne retournent que les mêmes valeurs p lors de l'appel wilcox.testavec correct=FALSE, et wilcox_test(dans le paquet de pièces) avec distribution="aymptotic". Pour les autres valeurs, ils renvoient des valeurs p différentes. Renvoie également wilcox.testtoujours W = 0 pour mon jeu de données, indépendamment des réglages de ses paramètres:

x = c(1, 1, 1, 3, 3, 3, 3) et y = c(4, 4, 6, 7, 7, 8, 10)

De plus, lorsque j'essaie d'utiliser différents outils autres que R (certains disponibles en ligne, d'autres en tant que modules complémentaires Excel), ils signalent parfois des valeurs p différentes.

Alors, comment puis-je savoir quel outil donne la valeur de p "correcte"?

Y a-t-il une valeur de p "correcte", ou si quelques outils donnent une valeur de p <0,05, dois-je être satisfait? (Parfois, ces outils n'offrent pas autant de possibilités de paramétrage comme R.)

Qu'est-ce que j'oublie ici?

mljrg
la source

Réponses:

18

La clé de votre question se trouve dans? Wilcox.test dans la section Notes:

La littérature n'est pas unanime sur les définitions de la somme de rang de Wilcoxon et des tests de Mann-Whitney.

Donc, cela signifie qu'il y a plus d'une façon de faire ce test non paramétrique de changement de position entre deux échantillons. De plus, compte tenu de chaque définition, il existe plusieurs façons d'obtenir une valeur ap. "exact" signifie qu'il est absolument correct, tandis que "approximatif" ou "asymptotique" sont les deux approximations de la vérité. C'est pourquoi il y a plusieurs options dans les deux wilcox.test()et wilcox_test(), et seulement certaines d'entre elles correspondent exactement - lorsque les deux fonctions font exactement la même chose. Il semble que l' wilcox_test()on puisse obtenir des valeurs p exactes même lorsqu'il existe des valeurs liées, tandis qu'il wilcox.test()revient à une approximation asymptotique lorsqu'il existe des valeurs liées. Je ne saurais pas quelle combinaison de calculs de statistiques et de valeurs p un module complémentaire Excel fait,

Votre prochaine question est pourquoi wilcox.test()retourne 0 tout le temps. Pour l'ensemble de données que vous avez créé, la valeur de la statistique de test est 0 lorsque vous effectuez wilcox.test (x, y), mais elle sera de 49 lorsque vous effectuez wilcox.test (y, x), bien que la valeur p soit le même. Voir la page wikipedia pour les raisons. wilcox_test()renvoie une transformation Z de la statistique renvoyée par wilcox.test(), c'est pourquoi ils ont des valeurs différentes de la statistique de test.

Y a-t-il une valeur de p correcte? Oui, mais parfois il est trop difficile à calculer, et nous devons donc utiliser des méthodes approximatives (voir? Wilcox_test pour des descriptions de la façon dont le calcul exact peut échouer en raison d'une mémoire insuffisante). Les différences entre l'approximation et la valeur exacte n'auront généralement pas d'importance à moins que la vraie différence dans l'emplacement des deux groupes soit très petite.

atiretoo - réintégrer monica
la source
(+1) Bienvenue sur notre site, Drew!
whuber