Comment signalez-vous un test de Mann – Whitney?

10

Je fais ma thèse, et je fais un certain nombre de tests. Après avoir utilisé un test de Kruskal – Wallis, je rapporte généralement le résultat comme ceci:

Il y a une différence significative entre les moyennes de ...(χ(2)2=7.448,p=.024)

Mais maintenant, j'ai effectué un test de Mann – Whitney, et je ne sais pas quelles valeurs présenter. SPSS me donne Mann-Whitney , Wilcoxon , et -value. Dois-je présenter toutes ces 4 valeurs? Ou certains sont-ils hors de propos?UWZP

aide à la dissertation
la source

Réponses:

12

Wikipédia semble avoir vos réponses. Voici un extrait de l'exemple de déclaration des résultats:

Lors de la communication des résultats d'un test de Mann – Whitney, il est important d'indiquer:

  • Une mesure des tendances centrales des deux groupes (moyennes ou médianes puisque le Mann-Whitney est un test ordinal, les médianes sont généralement recommandées)
  • La valeur de U
  • Les tailles d'échantillon
  • Le niveau de signification.

Dans la pratique, certaines de ces informations peuvent déjà avoir été fournies et le bon sens doit être utilisé pour décider de les répéter. Un rapport typique peut être exécuté,

"Les latences médianes dans les groupes E et C étaient de 153 et 247 ms; les distributions dans les deux groupes différaient considérablement (Mann – Whitney U = 10,5, n 1 = n 2 = 8, P <0,05 bilatéral)."

Le test de rang signé Wilcoxon est approprié pour les échantillons appariés, tandis que le test de Mann – Whitney suppose des échantillons indépendants. Cependant, selon Field (2000) , le Wilcoxon dans votre sortie SPSS est "une version différente de cette statistique, qui peut être convertie en un score Z et peut donc être comparée aux valeurs critiques de la distribution normale". Cela explique aussi votre score !Wz

Pour info, Wikipedia ajoute que, pour les grands échantillons, est distribué normalement normalement. Compte tenu de toutes ces valeurs, on peut également calculer la taille de l'effet , qui dans le cas de l'exemple de Wikipedia est 0,319 (une calculatrice est implémentée dans la section 11 ici ). Cependant, cette transformation de la statistique de test dépend de la normalité approximative de , elle peut donc être inexacte avec n s = 8 ( Fritz et al., 2012 ) .Uη2U

PS Les résultats du test Kruskal – Wallis ne doivent pas être interprétés comme révélant des différences entre les moyennes, sauf dans des circonstances particulières. Voir la réponse de @ Glen_b à une autre question, "Différence entre l'ANOVA et le test de Kruskal-Wallis" pour plus de détails.

Références

Field, A. (2000). 3.1. Test de Mann-Whitney. Méthodes de recherche 1: SPSS pour Windows partie 3: tests non paramétriques. Extrait de http://www.statisticshell.com/docs/nonparametric.pdf .
Fritz, CO, Morris, PE et Richler, JJ (2012). Estimation de la taille de l'effet: utilisation actuelle, calculs et interprétation. Journal of Experimental Psychology: General , 141 (1), 2–18. PDF disponible via ResearchGate .

Nick Stauner
la source
3
Quel est l'intérêt de rapporter la valeur de U dans l'exemple ci-dessus? Que puis-je, en tant que lecteur, gagner à savoir que U était 10,5?
amoeba
4
Dans l'exemple ci-dessus, vous gagnez la possibilité de calculer le exact , qui n'est pas donné et peut être utile pour l'estimation de la taille de l'effet, la méta-analyse ou la vérification du hachage. Un ami et collègue à moi @rpierce m'a également conseillé de rapporter les statistiques de test pour garantir aux lecteurs que je fais les choses correctement en général, car il a surpris de nombreux articles publiés qui le faisaient mal via des statistiques de test mal déclarées et des associés . ppdf
Nick Stauner
Intéressant. Je suppose que cette question pourrait être digne d'une question distincte, que je pourrais poser ici à un moment donné. Pourtant: si l'on veut des valeurs de p exactes, alors on peut signaler des valeurs de p exactes! En fait, le conseil habituel est de rapporter des valeurs p exactes, sauf si elles sont très petites, comme p <0,0001; mais dans ce cas, le p-hacking est peu probable. Et la taille de l'effet doit être rapportée séparément de toute façon, comme par exemple "les latences médianes dans les groupes E et C étaient de 153 et 247 ms" dans votre citation du wiki.
amoeba
1
Groupe Facebook secret (c'est-à-dire non consultable) pour les diplômés en psychologie de notre alma mater; aucun exemple inclus. Je suis curieux aussi. Peut-être que vous pouvez le faire partager si vous le taggez dans une question distincte :) Je parie que d'autres ici auraient beaucoup d'exemples avec lesquels sonner - c'est-à-dire, si la question n'est pas fermée comme hors-sujet ! Certainement une question plus fondamentale comme, "Pourquoi est-il important de rapporter des statistiques de test en plus de la taille de et d'effet?" serait sur le sujet cependant, je pense ... Vérifiez d'abord les doublons sous la balise de rapport , si vous voulez vraiment être en sécurité ...p
Nick Stauner
1
Lorsque les tailles d'échantillon ne sont pas si petites qu'elles seront mal interprétées, je pencherais pour rapporter un U ou W normalisé (normalisé, ils sont identiques) en tant que valeur Z ( disons), car les lecteurs auront un sens intuitif de ce que cela signifie - bien qu'il devienne alors nécessaire d'être clair lorsque vous avez la valeur de p exacte si vous le faites, pas une basée sur le score Z pour la statistique. ZU
Glen_b -Reinstate Monica