Il est bien connu que l'efficacité relative asymptotique (ARE) du test de rang signé de Wilcoxon est de par rapport autestt deStudent, si les données sont tirées d'une population normalement distribuée. Cela est vrai à la fois pour le test de base à un échantillon et pour la variante pour deux échantillons indépendants (le Wilcoxon-Mann-Whitney U). C'est aussi l'ARE d'un test de Kruskal-Wallis par rapport à un test ANOVAF, pour des données normales.
Ce résultat remarquable (pour moi, une des " apparitions les plus inattendues de ") et remarquablement simple a-t-il une preuve perspicace, remarquable ou simple?
nonparametric
wilcoxon-mann-whitney
asymptotics
efficiency
wilcoxon-signed-rank
Silverfish
la source
la source
Réponses:
Bref croquis de ARE pour le test à un échantillont , le test signé et le test de rang signé
Je m'attends à ce que la version longue de la réponse de @ Glen_b comprenne une analyse détaillée pour le test de classement signé à deux échantillons ainsi que l'explication intuitive de l'ARE. Je vais donc ignorer la plupart des dérivations. (cas d'un échantillon, vous pouvez trouver les détails manquants dans Lehmann TSH).
Problème de test : Soit un échantillon aléatoire du modèle de localisation f ( x - θ ) , symétrique par rapport à zéro. Nous devons calculer ARE de test signé, test de rang signé pour l'hypothèse H 0 : θ = 0 par rapport au test t.X1, … , Xn F( x - θ ) H0: θ = 0
Pour évaluer l'efficacité relative des tests, seules les alternatives locales sont prises en compte car les tests cohérents ont une puissance tendant à 1 contre une alternative fixe. Les alternatives locales qui donnent lieu à une puissance asymptotique non triviale sont souvent de la forme pourhfixe, qui est appelédérive de Pitmandans certaines publications.θn= h / n--√ h
Notre tâche à venir est
Test statistique et asymptotique
Par conséquent, A R E ( W n ) = ( √
Si est uniforme sur [-1,1], A R E ( S n ) = 1 / trois , A R E ( W n ) = 1 / troisf ARE(Sn)=1/3 ARE(Wn)=1/3
Remarque sur la dérivation de la distribution sous l'alternative
Il existe bien sûr de nombreuses façons de dériver la distribution limite sous l'alternative. Une approche générale consiste à utiliser le troisième lemme de Le Cam. Version simplifiée de celui-ci indique
la source
This has nothing to do with explaining whyπ appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t -test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t -test is the square of the correlation between the scores used for the two tests. As n→∞ the squared correlation converges to π3 . You can easily see this empirically using R:
la source
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(which obviously produces the same result)?Version courte: La raison fondamentale avec Wilcoxon-Mann-Whitney dans une alternative de décalage est que trouver l'efficacité relative asymptotique (WMW / t) correspond à évaluer12 σ2[ ∫F2( x ) dx ]2 où F est la densité commune au nul et σ est la variance commune.
Donc, à la normale,F2 est en fait une version à l'échelle de F ; son intégrale aura un1π√ terme; au carré, c'est la source duπ .
Le même terme - avec la même intégrale - est impliqué dans l'ARE pour le test de classement signé, il prend donc la même valeur.
Pour le test de signe relatif à t, l'ARE est4 σ2F( 0 )2 ... et F( 0 )2 a encore une π en elle.
Donc, c'est essentiellement comme je l'ai dit dans les commentaires;π est dans l'ARE pour le test de Wilcoxon-Mann-Whitney vs le test t à deux échantillons, pour le test de rang signé Wilcoxon vs le t à un échantillon et le test de signe vs le test t à un échantillon (dans chaque cas à la normale) littéralement parce qu'il apparaît dans la densité normale.
Référence:
JL Hodges et EL Lehmann (1956),
"L'efficacité de certains concurrents non paramétriques du test t",
Ann. Math. Statist. , 27 : 2, 324-335.
la source