Kolmogorov Smirnov Z vs Mann Whitney U petit échantillon n = 15?

8

J'ai un petit échantillon de 15. Je veux voir s'il y a une différence dans les apports nutritionnels entre deux variables indépendantes, groupe 1 n = 11, groupe 2 n = 4. Les données ne sont pas normalement distribuées. Quel test est le plus approprié, le test Mann Whitney U ou le test Kolmogorov-Smirnov Z? Les statistiques de découverte d' Andy Field utilisant SPSS indiquent que KS Z doit être utilisé pour les petits échantillons:

Kolmogorov-Smirnov Z: Dans le chapitre 5, nous avons rencontré un test de Kolmogorov-Smirnov qui testait si un échantillon provenait d'une population normalement distribuée. Ceci est un test différent! En fait, il vérifie si deux groupes sont issus de la même population (quelle que soit cette population). En fait, cela signifie qu'il fait à peu près la même chose que le test de Mann – Whitney! Cependant, ce test a tendance à avoir une meilleure puissance que le test de Mann – Whitney lorsque la taille des échantillons est inférieure à environ 25 par groupe, et vaut donc la peine d'être sélectionné si c'est le cas.

De même, lors de la déclaration des apports avec les valeurs de p, dois-je utiliser la moyenne et l'écart-type ou la médiane et l'IQR car les données ne sont pas paramétriques?

Tout avis serait grandement apprécié.

AMH40
la source
3
Les données sont ce qu'elles sont; ce sont des procédures et non des données non paramétriques ou paramétriques. Dans ce cas, veuillez publier les données. Une non-normalité légère n'est pas fatale à de nombreuses procédures.
Nick Cox
2
Sur ce texte de Field, voir @whuber à stats.stackexchange.com/questions/157217/… "certaines des questions vraiment confuses que nous obtenons sur ce site ... doivent provenir des lecteurs de ce livre. Il est plein d'erreurs, désinformation et confabulation pure et simple. "
Nick Cox
2
J'exercerais également une extrême prudence avec ce livre. Il serait préférable de savoir s'il existe des preuves que les nombreuses affirmations que vous citez sont vraies que de simplement supposer qu'elles sont correctes.
Glen_b -Reinstate Monica
J'ai lu cette question car vous avez une variable de réponse ou de résultat et un prédicteur qui définit deux groupes. Les termes variables dépendantes et indépendantes sont souvent inversés par inadvertance, l'un des nombreux arguments pour éviter ces termes, aussi familiers soient-ils.
Nick Cox
La réponse exceptionnelle de @Glen_b ne fait naturellement pas la lumière sur vos données spécifiques. Vous pouvez toujours le publier et laisser les gens jouer avec des recommandations.
Nick Cox

Réponses:

13

Si la déclaration d'origine ne limite pas sensiblement les conditions dans lesquelles elle s'applique, Field a tout simplement tort.

Répondant à la section citée:

En fait, cela signifie qu'il fait à peu près la même chose que le test de Mann – Whitney!

Non, ce n'est vraiment pas le cas. Ils testent vraiment différents types de choses. À titre d'exemple, si deux distributions proches de symétriques diffèrent dans la répartition mais ne diffèrent pas dans l'emplacement, le Kolmogorov-Smirnov peut identifier ce genre de différence (dans des échantillons suffisamment grands par rapport à l'effet), mais le Wilcoxon-Mann-Whitney ne peut pas.

C'est parce qu'ils sont conçus à des fins différentes.

"Cependant, ce test a tendance à avoir une meilleure puissance que le test de Mann – Whitney lorsque la taille des échantillons est inférieure à environ 25 par groupe, et vaut donc la peine d'être sélectionné si c'est le cas."

En règle générale, cela n'a aucun sens. Contre les choses que le Mann-Whitney ne teste pas, il a un meilleur pouvoir, mais contre les choses auxquelles le Mann-Whitney est destiné, il ne le fait pas. Cela ne change pas lorsque .n<25

[Il peut y avoir une situation où la demande est vraie; si Field n'explique pas dans quel contexte sa réclamation s'applique, je ne serai probablement pas en mesure de le deviner.]

Voici une courbe de puissance pour n = 20 par groupe. Le niveau de signification est un peu plus de 3% pour chaque test (en fait, le niveau de signification réalisable pour le KS est légèrement plus élevé et je n'ai pas essayé d'utiliser un test randomisé pour ajuster cette différence, donc il a été donné un petit avantage dans cette comparaison ):

Diagramme de puissance à divers décalages pour des échantillons normaux sous alternative de décalage à n = 20 dans chaque groupe

Comme nous le voyons, dans ce cas (le premier que j'ai essayé), le Wilcoxon-Mann-Whitney est clairement plus puissant.

À n = 5, le Kolmogorov-Smirnov reste moins puissant pour cette situation. [Alors de quoi diable parle-t-il? Compare-t-il le pouvoir à une situation non mentionnée dans la citation? Je ne sais pas, mais pour ce qui est de ce qui est cité ici, nous ne devons pas prendre cette affirmation pour argent comptant. C'était mal dans la première chose que j'ai vérifiée, et - sur la base d'une connaissance plus large des deux tests, je parierais volontiers que c'est mal pour un tas d'autres situations.]

Aux tailles d'échantillon de 4 et 11 pour les alternatives de quart (et les populations normales), encore une fois, le Wilcoxon-Mann-Whitney fait mieux.

Avec la variable que vous regardez, une alternative appropriée est probablement quelque chose de plus comme un changement d'échelle; mais si une certaine puissance (comme une racine carrée ou une racine de cube ou mieux encore un journal) de vos données n'est pas trop anormale, ces résultats que je mentionne devraient être pertinents. Si vous avez des données discrètes ou gonflées à zéro qui peuvent faire une différence, mais je parie que le Kolmogorov-Smirnov ne dépasse pas le Wilcoxon-Mann-Whitney alors non plus. [Je ne poursuivrai pas cela pour le moment car il n'est pas clair si cela est pertinent pour votre situation.]

De plus, les niveaux de signification atteignables avec le Kolmogorov-Smirnov sont très espacés pour les petits échantillons. Souvent, vous ne pouvez pas obtenir des tests proches des niveaux de signification habituels que vous voudrez probablement. (Le WMW fait beaucoup mieux que le KS en ce qui concerne les tailles de test disponibles. Il existe un moyen judicieux d'améliorer considérablement cette situation de niveaux de niveaux sans perdre la nature non paramétrique ou basée sur le classement de tests comme ceux-ci - cela ne fait pas non plus impliquent des tests randomisés - mais il semble être très rarement utilisé pour une raison quelconque.)

Notez que j'ai soigneusement choisi des exemples qui ont rendu les niveaux des deux tests presque comparables. Si vous êtes juste choisir à chaque fois sans tenir compte des niveaux disponibles et en comparant une valeur de p à celle, le gappiness des niveaux réalisables de Kolmogorov-Smirnov va faire son pouvoir bien pire en général (bien que la volonté très occasionnellement, aidez-le un peu comme ici - ces avantages ne seront généralement pas beaucoup cependant et probablement pas suffisants pour l'aider à battre le WMW à la tâche pour laquelle il est adapté).α=0.05

Si vous êtes dans une situation où le Wilcoxon-Mann-Whitney teste ce que vous voulez tester, je ne recommanderais certainement pas d'utiliser le Kolmogorov-Smirnov à la place. J'utiliserais chaque test pour ce qu'ils sont conçus pour tester, c'est là qu'ils ont tendance à faire assez bien.

La meilleure façon de déterminer ce qui est le mieux est d'essayer des simulations dans des situations qui seraient réalistes pour le type de données que vous aurez. Ensuite, vous pouvez voir quand il fait quoi.

De même, lors de la déclaration des apports avec les valeurs de p, dois-je utiliser la moyenne et l'écart-type ou la médiane et l'IQR car les données ne sont pas paramétriques?

Les données ne sont que des données. Ils ne sont ni paramétriques ni non paramétriques - c'est une propriété des modèles et des procédures inférentielles que nous utilisons qui s'appuient sur eux (estimation, test, intervalles). Paramétrique signifie "défini jusqu'à un nombre fini et fixe de paramètres", qui n'est pas un attribut de données mais de modèles. Si vous ne pouvez pas simplement donner les deux ensembles de valeurs (ce qui serait ma préférence) et devez plutôt choisir l'un ou l'autre, ce qui est plus pertinent scientifiquement ou par rapport à votre question d'intérêt?

[Notez que le Wilcoxon-Mann-Whitney ne compare ni les moyennes ni les médianes (sauf si vous ajoutez des hypothèses que je parie ne sont pas près de s'appliquer dans ce cas). Le Kolmogorov-Smirnov non plus.]

Glen_b -Reinstate Monica
la source