Test de Mann-Whitney U avec des tailles d'échantillons inégales

13

J'ai deux groupes inégaux (94 et 52) ​​et je veux effectuer un test U de Mann-Whitney pour voir si leurs scores sur une variable mesurée diffèrent. Je vois que c'est OK pour Kruskall-Wallis, est-ce la même chose pour Mann-Whitney?

George
la source
3
Mann-Whitney (en comparant deux groupes) n'est que le cas spécial de Kruskal-Wallis (plus de deux groupes), alors oui.
Miroslav Sabo

Réponses:

14

Oui, le test de Mann-Whitney fonctionne bien avec des tailles d'échantillon inégales.

Harvey Motulsky
la source
Pouvez-vous exposer une référence publiée pour cela?
5
@jorge Mann, Henry B .; Whitney, Donald R. (1947). " Sur un test de savoir si l'une des deux variables aléatoires est stochastiquement plus grande que l'autre ". Annals of Mathematical Statistics 18 (1): 50–60. --- le but de l'article original était de dériver la distribution pour deux échantillons de tailles différentes, et de montrer sa cohérence et sa normalité asymptotique ainsi que de donner la distribution exacte pour les petits échantillons.
Glen_b -Reinstate Monica
12

@HarveyMotulsky a raison, vous pouvez utiliser le test U de Mann-Whitney avec des tailles d'échantillons inégales. Notez cependant que votre puissance statistique (c'est-à-dire la capacité de détecter une différence qui existe réellement) diminuera à mesure que la taille des groupes deviendra plus inégale. Par exemple, j'ai une simulation (en fait d'un test t, mais le principe est le même) qui le démontre ici .

gung - Réintégrer Monica
la source
2
En effet, l'analogie avec le est assez directe, puisque la statistique de Mann-Whitney est fonction monotone d'une statistique de t calculée sur les rangs. La précision d'une différence de moyenne de population dans le test t est une simple fonction de et ( ceteris paribus ), et la même chose s'applique au Mann-Whitney en ce qui concerne la différence de rang moyen attendu pour les deux échantillons. La même analogie appropriée avec le domaine que vous mentionnez dans votre réponse liée s'applique ici dans le sens de maximiser la précision de cette différence. n 1 n 2tn1n2
Glen_b -Reinstate Monica