Rang et transformation en z au lieu de Wilcoxon?

(Sort Conover [1] de la bibliothèque ...)

Cette idée est assez ancienne; il remonte au moins à van der Waerden (1952/1953) [2] [3], qui a suggéré un test qui correspond au Kruskal Wallis mais avec des rangs remplacés par des scores normaux. (L'idée d'utiliser des valeurs normales aléatoires ordonnées plutôt qu'une approximation de leur attente ou de leur médiane - est peut-être même un peu plus ancienne.)

Selon Conover, Fisher et Yates (1957) [4] suggèrent de remplacer les observations par des scores normaux attendus (c'est-à-dire des rangs transformés) dans une variété de tests où la normalité serait supposée.

L'efficacité relative asymptotique à la normale sera de 1, ce qui le rend assez attrayant ... cependant, l'avantage par rapport au Wilcoxon-Mann-Whitney (gain de puissance) - même à la normale - est assez petit, et si la distribution est plus lourde que la normale (disons logistique), il peut être désavantageux de le faire. (Certaines simulations suggèrent que c'est en fait le cas: à moins que la distribution ne soit déjà proche de la normale - auquel cas il n'y a aucun avantage à effectuer la transformation - une telle transformation peut en fait perdre du pouvoir.)

Chernoff & Lehmann [5] calculent la puissance asymptotique pour une variété de distributions; où il y a au moins une queue très courte (comme l'uniforme), le test de score normal peut avoir beaucoup mieux ARE pour une alternative de décalage contre le Wilcoxon-Mann-Whitney - mieux que le test t lui-même. Leurs résultats concordent avec mes simulations pour les cas à queue plus lourde.

Notez que dans le cas de deux échantillons, comme la séparation dans les moyennes devient importante, alors que l'échantillon combiné semble tout à fait normal, les deux échantillons ne sont pas normaux du tout:

entrez la description de l'image ici

Par conséquent, toutes les propriétés du test normal ne seront pas transférées au test de score normal, et le comportement à des séparations plus importantes (avec de petits échantillons) peut être quelque peu contre-intuitif.

Les tests obtenus par cette idée sont parfois appelés collectivement tests de scores normaux , ce terme de recherche (via Google, par exemple) faisant apparaître un certain nombre de références.

Par exemple, ici , Richard Darlington explique comment le faire pour le test des rangs signés de Wilcoxon; il souligne qu'il y a un avantage sur le test de rang simple, car il réduit le nombre de valeurs liées de la statistique de test.

Avant de finir d'écrire des pages dessus, je vous laisse chercher plus loin.

Conover répertorie un certain nombre d'autres références et a beaucoup de discussions, donc je recommanderais certainement de lire cela.

Le point de Gelman, cependant, semble être sur la commodité - pas besoin de développer un nouveau test chaque fois que la situation change; mais si la commodité est le principal problème, il est déjà possible d'utiliser des tests de permutation sur n'importe quelle statistique que nous aimons. [Avec l'approche des scores normaux, la difficulté est que nous avons toujours besoin d'un moyen approprié pour classer - vous ne pouvez pas simplement classer les choses qui ne sont pas comparables sous le zéro et vous attendre au bon type de comportement. Il y a un problème similaire avec le test de permutation, car vous avez également besoin d'échangeabilité sous la valeur NULL.]

Vous mentionnez une fonction R, mais vous pouvez facilement classer et convertir en scores normaux dans R simplement en utilisant des fonctions déjà fournies avec R.

par exemple en utilisant les sleepdonnées dans R. vous feriez un test t de cette façon:

 t.test(extra ~ group, data = sleep)  # Welch
 t.test(extra ~ group, data = sleep, var.equal=TRUE)  # equal-variance
 t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep)  # normal scores

[1] Conover, WJ (1980),
Statistiques pratiques non paramétriques , 2e.
Wiley. pp. 316–327.

(À partir du lien Wikipédia ci-dessus, il semble que dans 3e (1999), la discussion commence à la p396)

[2] van der Waerden, BL (1952),
"Order tests for the two-sample problem and their power",
Actes de la Koninklijke Nederlandse Akademie van Wetenschappen , Série A 55 ( Indagationes Mathematicae 14 ), 453–458.

[3] van der Waerden, BL (1953),
"Order tests for the two-sample problem. II, III",
Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 & 311–316.

(il y a aussi des corrections à l'article de 1952 à la p 80 de ce volume)

[4] Fisher RA et Yates F. (1957)
Tableaux statistiques pour la recherche biologique, agricole et médicale , 5e, Oliver & Boyd, Édimbourg.

[5] Hodges, JL; Lehmann, EL (1961),
«Comparison of the Normal Scores and Wilcoxon Tests»,
Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Contributions to the Theory of Statistics , 307-317,
University of California Press, Berkeley, Californie
http://projecteuclid.org/euclid.bsmsp/1200512171 .

Glen_b -Reinstate Monica
la source

Glen, c'est un sujet intéressant (sur lequel j'aimerais en savoir plus) et une bonne réponse à vous. Mais puis-je vous prier d'y ajouter de la chair (discours / conclusions) en plus des liens? Et, éventuellement, collecter des liens vers des questions / réponses similaires sur ce site? Je vous remercie.

ttnphns

Grand sujet. Existe-t-il des comparaisons publiées de pommes à pommes d'une approche non paramétrique et d'une approche de scores normaux (avec test paramétrique) pour les tests de différences de moyennes? Mon collègue et moi en avons pour les tests de corrélations, mais c'est tout ce que je sais. Dans le contexte de corrélation, les scores normaux conduisent à une puissance légèrement meilleure que le test de rang (corrélation Spearman) ou le test paramétrique non transformé (Pearson). Je suis curieux de savoir si des résultats similaires se produisent dans d'autres contextes.

Anthony

@Antony. Le point [5] pointé par Glen, contient une comparaison pomme à pomme des scores normaux et de Wilcoxon basée sur l'efficacité asymptotique. Le chercheur répertorie 114 citations de cet article, certains d'entre eux devraient fournir d'autres formes de comparaison.

Jacques Wainer du

@Glen_b, pour les corrélations, l'avantage des scores normaux était le plus important lorsque les deux variables étaient extrêmement anormales (par exemple, les deux ~

χ^{2}, d f = 1

$\chi^2, df=1$ ) et n était grand (> = 20, mais encore plus grand montrait de plus grands avantages). D'autres travaux suggèrent à la fois l'asymétrie et la kurtose. Si vous êtes intéressé, la référence peut être trouvée ici: stats.stackexchange.com/questions/131369/…

Anthony

Désolé pour tous les commentaires, mais je ne peux pas retenir un fil aussi amusant! Une autre réflexion - la figure de @ Glen_b pointe vers un problème appelé "héritage" par Zimmerman (2011). Même après la transformation, les échantillons séparés peuvent «hériter» de certaines des propriétés de la distribution d'origine non transformée. redalyc.org/articulo.oa?id=16917012005

Anthony

Rang et transformation en z au lieu de Wilcoxon?

Réponses: