Rang et transformation en z au lieu de Wilcoxon?

8

Andrew Gelman dans un récent article de son blog suggère d'utiliser un classement, de transformer le classement en z-score, puis d'utiliser des tests et des outils paramétriques au lieu d'effectuer des tests non paramétriques. Je n'en avais jamais entendu parler auparavant.

Une recherche sur Google m'a montré cette fonction R dans le package GenABEL , qui semble effectuer la transformation rang + z d'un vecteur de données mais je n'ai pas pu trouver d'articles qui évaluent ou discutent l'idée d'utiliser des tests paramétriques sur les données transformées à la place des tests de Wilcoxon.

Quelqu'un peut-il m'indiquer une littérature sur cette méthode?

Jacques Wainer
la source
2
Ce n'est pas un test paramétrique. Vous venez d'utiliser une approximation asymptotique de la distribution nulle d'une statistique basée sur le rang.
dsaxton
1
@dsaxton Dans de nombreux cas, il s'agit d'un test non paramétrique (ou plutôt d'une approximation à un). Le remplacement des rangs par un ensemble de scores fixe (compte tenu de la taille des échantillons) ne modifie pas le manque de dépendance à l'égard des formes de distribution d'origine sous le zéro.
Glen_b -Reinstate Monica

Réponses:

10

(Sort Conover [1] de la bibliothèque ...)

Cette idée est assez ancienne; il remonte au moins à van der Waerden (1952/1953) [2] [3], qui a suggéré un test qui correspond au Kruskal Wallis mais avec des rangs remplacés par des scores normaux. (L'idée d'utiliser des valeurs normales aléatoires ordonnées plutôt qu'une approximation de leur attente ou de leur médiane - est peut-être même un peu plus ancienne.)

Selon Conover, Fisher et Yates (1957) [4] suggèrent de remplacer les observations par des scores normaux attendus (c'est-à-dire des rangs transformés) dans une variété de tests où la normalité serait supposée.

L'efficacité relative asymptotique à la normale sera de 1, ce qui le rend assez attrayant ... cependant, l'avantage par rapport au Wilcoxon-Mann-Whitney (gain de puissance) - même à la normale - est assez petit, et si la distribution est plus lourde que la normale (disons logistique), il peut être désavantageux de le faire. (Certaines simulations suggèrent que c'est en fait le cas: à moins que la distribution ne soit déjà proche de la normale - auquel cas il n'y a aucun avantage à effectuer la transformation - une telle transformation peut en fait perdre du pouvoir.)

Chernoff & Lehmann [5] calculent la puissance asymptotique pour une variété de distributions; où il y a au moins une queue très courte (comme l'uniforme), le test de score normal peut avoir beaucoup mieux ARE pour une alternative de décalage contre le Wilcoxon-Mann-Whitney - mieux que le test t lui-même. Leurs résultats concordent avec mes simulations pour les cas à queue plus lourde.

Notez que dans le cas de deux échantillons, comme la séparation dans les moyennes devient importante, alors que l'échantillon combiné semble tout à fait normal, les deux échantillons ne sont pas normaux du tout:

entrez la description de l'image ici

Par conséquent, toutes les propriétés du test normal ne seront pas transférées au test de score normal, et le comportement à des séparations plus importantes (avec de petits échantillons) peut être quelque peu contre-intuitif.

Les tests obtenus par cette idée sont parfois appelés collectivement tests de scores normaux , ce terme de recherche (via Google, par exemple) faisant apparaître un certain nombre de références.

Par exemple, ici , Richard Darlington explique comment le faire pour le test des rangs signés de Wilcoxon; il souligne qu'il y a un avantage sur le test de rang simple, car il réduit le nombre de valeurs liées de la statistique de test.

Avant de finir d'écrire des pages dessus, je vous laisse chercher plus loin.

Conover répertorie un certain nombre d'autres références et a beaucoup de discussions, donc je recommanderais certainement de lire cela.

Le point de Gelman, cependant, semble être sur la commodité - pas besoin de développer un nouveau test chaque fois que la situation change; mais si la commodité est le principal problème, il est déjà possible d'utiliser des tests de permutation sur n'importe quelle statistique que nous aimons. [Avec l'approche des scores normaux, la difficulté est que nous avons toujours besoin d'un moyen approprié pour classer - vous ne pouvez pas simplement classer les choses qui ne sont pas comparables sous le zéro et vous attendre au bon type de comportement. Il y a un problème similaire avec le test de permutation, car vous avez également besoin d'échangeabilité sous la valeur NULL.]

Vous mentionnez une fonction R, mais vous pouvez facilement classer et convertir en scores normaux dans R simplement en utilisant des fonctions déjà fournies avec R.

par exemple en utilisant les sleepdonnées dans R. vous feriez un test t de cette façon:

 t.test(extra ~ group, data = sleep)  # Welch
 t.test(extra ~ group, data = sleep, var.equal=TRUE)  # equal-variance
 t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep)  # normal scores

[1] Conover, WJ (1980),
Statistiques pratiques non paramétriques , 2e.
Wiley. pp. 316–327.

(À partir du lien Wikipédia ci-dessus, il semble que dans 3e (1999), la discussion commence à la p396)

[2] van der Waerden, BL (1952),
"Order tests for the two-sample problem and their power",
Actes de la Koninklijke Nederlandse Akademie van Wetenschappen , Série A 55 ( Indagationes Mathematicae 14 ), 453–458.

[3] van der Waerden, BL (1953),
"Order tests for the two-sample problem. II, III",
Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 & 311–316.

(il y a aussi des corrections à l'article de 1952 à la p 80 de ce volume)

[4] Fisher RA et Yates F. (1957)
Tableaux statistiques pour la recherche biologique, agricole et médicale , 5e, Oliver & Boyd, Édimbourg.

[5] Hodges, JL; Lehmann, EL (1961),
«Comparison of the Normal Scores and Wilcoxon Tests»,
Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Contributions to the Theory of Statistics , 307-317,
University of California Press, Berkeley, Californie
http://projecteuclid.org/euclid.bsmsp/1200512171 .

Glen_b -Reinstate Monica
la source
Glen, c'est un sujet intéressant (sur lequel j'aimerais en savoir plus) et une bonne réponse à vous. Mais puis-je vous prier d'y ajouter de la chair (discours / conclusions) en plus des liens? Et, éventuellement, collecter des liens vers des questions / réponses similaires sur ce site? Je vous remercie.
ttnphns
Grand sujet. Existe-t-il des comparaisons publiées de pommes à pommes d'une approche non paramétrique et d'une approche de scores normaux (avec test paramétrique) pour les tests de différences de moyennes? Mon collègue et moi en avons pour les tests de corrélations, mais c'est tout ce que je sais. Dans le contexte de corrélation, les scores normaux conduisent à une puissance légèrement meilleure que le test de rang (corrélation Spearman) ou le test paramétrique non transformé (Pearson). Je suis curieux de savoir si des résultats similaires se produisent dans d'autres contextes.
Anthony
1
@Antony. Le point [5] pointé par Glen, contient une comparaison pomme à pomme des scores normaux et de Wilcoxon basée sur l'efficacité asymptotique. Le chercheur répertorie 114 citations de cet article, certains d'entre eux devraient fournir d'autres formes de comparaison.
Jacques Wainer du
1
@Glen_b, pour les corrélations, l'avantage des scores normaux était le plus important lorsque les deux variables étaient extrêmement anormales (par exemple, les deux ~χ2,F=1) et n était grand (> = 20, mais encore plus grand montrait de plus grands avantages). D'autres travaux suggèrent à la fois l'asymétrie et la kurtose. Si vous êtes intéressé, la référence peut être trouvée ici: stats.stackexchange.com/questions/131369/…
Anthony
1
Désolé pour tous les commentaires, mais je ne peux pas retenir un fil aussi amusant! Une autre réflexion - la figure de @ Glen_b pointe vers un problème appelé "héritage" par Zimmerman (2011). Même après la transformation, les échantillons séparés peuvent «hériter» de certaines des propriétés de la distribution d'origine non transformée. redalyc.org/articulo.oa?id=16917012005
Anthony