Il s'agit d'une question complémentaire à ce que Frank Harrell a écrit ici :
D'après mon expérience, la taille d'échantillon requise pour que la distribution t soit précise est souvent plus grande que la taille d'échantillon à portée de main. Le test de rang signé de Wilcoxon est extrêmement efficace comme vous l'avez dit, et il est robuste, donc je le préfère presque toujours au test t
Si je comprends bien - lorsque nous comparons l'emplacement de deux échantillons inégalés, nous préférerions utiliser le test de somme de rang de Wilcoxon plutôt que le test t non apparié, si nos tailles d'échantillon sont petites.
Existe-t-il une situation théorique où nous préférerions le test de somme de rang de Wilcoxon au test t non apparié, même si la taille des échantillons de nos deux groupes est relativement grande?
Ma motivation pour cette question découle de l'observation que pour un test t à échantillon unique, son utilisation pour un échantillon pas si petit d'une distribution asymétrique produira une erreur de type I erronée:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error
la source
Réponses:
Oui il y a. Par exemple, tout échantillonnage à partir de distributions avec une variance infinie anéantira le test t, mais pas le Wilcoxon. En me référant aux méthodes statistiques non paramétriques (Hollander et Wolfe), je vois que l'efficacité relative asymptotique (ARE) du Wilcoxon par rapport au test t est de 1,0 pour la distribution uniforme, 1,097 (c'est-à-dire que Wilcoxon est meilleur) pour la logistique, 1,5 pour le double exponentiel (Laplace) et 3.0 pour l'exponentiel.
Hodges et Lehmann ont montré que l'ARE minimum du Wilcoxon par rapport à tout autre test est de 0,864, vous ne pouvez donc jamais perdre plus d'environ 14% d'efficacité en l'utilisant par rapport à autre chose. (Bien sûr, c'est un résultat asymptotique.) Par conséquent, l'utilisation par Frank Harrell du Wilcoxon par défaut devrait probablement être adoptée par presque tout le monde, y compris moi-même.
Edit: En réponse à la question de suivi dans les commentaires, pour ceux qui préfèrent les intervalles de confiance, l' estimateur de Hodges-Lehmann est l'estimateur qui "correspond" au test de Wilcoxon, et des intervalles de confiance peuvent être construits autour de cela.
la source
Permettez-moi de vous ramener à notre discussion en commentant cette question. Le test de somme de Wilcoxon est équivalent au test de Mann-Whitney U (et son extension directe pour plus de deux échantillons est appelée test de Kruskal-Wallis). Vous pouvez voir sur Wikipedia ainsi que dans ce texte que Mann-Whitney (ou Kruskal-Wallis) ne compare généralement pas des moyennes ou des médianes. Il compare la prévalence globale des valeurs: lequel des échantillons est "stochastiquement supérieur". Le test est sans distribution. Le test T compare les moyennes. Il suppose une distribution normale. Ainsi, les tests s'engagent dans différentes hypothèses. Dans la plupart des cas, nous ne prévoyons pas de comparer spécifiquement les moyennes, nous voulons plutôt savoir quel échantillon est supérieur en termes de valeurs, et cela fait de Mann-Whitney le test par défaut pour nous. D'un autre côté, lorsque les deux distributions sont symétriques, la tâche de tester si un échantillon est "plus grand" que l'autre dégénère en une tâche de comparaison des deux moyennes, puis, si les distributions sont normales avec des variances égales, le test t devient quelque peu plus puissant.
la source