Pourquoi l'efficacité relative asymptotique du test de Wilcoxon est-elle de

13

Il est bien connu que l'efficacité relative asymptotique (ARE) du test de rang signé de Wilcoxon est de 3π0.955par rapport autestt deStudent, si les données sont tirées d'une population normalement distribuée. Cela est vrai à la fois pour le test de base à un échantillon et pour la variante pour deux échantillons indépendants (le Wilcoxon-Mann-Whitney U). C'est aussi l'ARE d'un test de Kruskal-Wallis par rapport à un test ANOVAF, pour des données normales.

Ce résultat remarquable (pour moi, une des " apparitions les plus inattendues de π ") et remarquablement simple a-t-il une preuve perspicace, remarquable ou simple?

Silverfish
la source
Compte tenu de l'apparition de π dans la cdf normale, l'apparition de π dans l'ARE ne devrait pas vraiment être tout à fait surprenant. Je vais hasarder une réponse, mais il faudra un certain temps pour en faire une bonne.
Glen_b -Reinstate Monica
1
@Glen_b En effet - J'ai déjà vu une discussion "pourquoi π apparaît-il autant dans les statistiques" (mais je ne me souviens pas si c'était sur CV ou non) et "à cause de la distribution normale" je sais que ça revient souvent, mais 3/π est toujours agréablement surprenant la première fois que vous le voyez. Pour comparaison, l'ARE de Mann-Whitney vs le test t à deux échantillons est de 3 sur les données exponentielles, 1,5 sur la double exponentielle et 1 sur l'uniforme - beaucoup plus rond!
Silverfish
1
@Silverfish J'ai lié la page 197 de van der Vaart "Statistiques asymptotiques". Pour un échantillon, les tests de signe ont ARE 2/π rapport au test t.
Khashaa
1
@Silverfish ... et à la logistique c'est (π/3)2 . Il existe un bon nombre des ARE bien connus (dans un ou deux cas d'échantillon) impliquant π et un assez grand nombre qui sont de simples rapports d'entiers.
Glen_b -Reinstate Monica
1
Pour le test de rang signé à un échantillon, il semble être 3/π . Pour le test de signe à un échantillon, il s'agit de 2/π . Nous avons donc clarifié notre position. Je pense que c'est un bon signe.
Khashaa

Réponses:

10

Bref croquis de ARE pour le test à un échantillon t, le test signé et le test de rang signé

Je m'attends à ce que la version longue de la réponse de @ Glen_b comprenne une analyse détaillée pour le test de classement signé à deux échantillons ainsi que l'explication intuitive de l'ARE. Je vais donc ignorer la plupart des dérivations. (cas d'un échantillon, vous pouvez trouver les détails manquants dans Lehmann TSH).

Problème de test : Soit un échantillon aléatoire du modèle de localisation f ( x - θ ) , symétrique par rapport à zéro. Nous devons calculer ARE de test signé, test de rang signé pour l'hypothèse H 0 : θ = 0 par rapport au test t.X1,,Xnf(xθ)H0:θ=0

Pour évaluer l'efficacité relative des tests, seules les alternatives locales sont prises en compte car les tests cohérents ont une puissance tendant à 1 contre une alternative fixe. Les alternatives locales qui donnent lieu à une puissance asymptotique non triviale sont souvent de la forme pourhfixe, qui est appelédérive de Pitmandans certaines publications.θn=h/nh

Notre tâche à venir est

  • trouver la distribution limite de chaque statistique de test sous la valeur nulle
  • trouver la distribution limite de chaque statistique de test sous l'alternative
  • calculer la puissance asymptotique locale de chaque test

Test statistique et asymptotique

  1. test t (étant donné l'existence de ) t n = σt n =
    tn=nX¯σ^N(0,1)sous le nul
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • donc le test qui rejette si a une fonction de puissance asymptotique 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. test signé Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    et a un pouvoir asymptotique local 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. test de rang signé W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    et a une puissance asymptotique locale 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Par conséquent, A R E ( W n ) = (

ARE(Sn)=(2f(0)σ)2
Sifest la densité normale standard,ARE(Sn)=2/π,ARE(Wn)=3/π
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

Si est uniforme sur [-1,1], A R E ( S n ) = 1 / trois , A R E ( W n ) = 1 / troisfARE(Sn)=1/3ARE(Wn)=1/3

Remarque sur la dérivation de la distribution sous l'alternative

Il existe bien sûr de nombreuses façons de dériver la distribution limite sous l'alternative. Une approche générale consiste à utiliser le troisième lemme de Le Cam. Version simplifiée de celui-ci indique

Soit le log du rapport de vraisemblance. Pour certains statistique W n , si ( W n , Δ n ) D N [ ( μ - σ 2 / 2 ) , ( σ 2 W T permet T permet σ 2 / 2 ) ]ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
sous le nul, alors
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)
Khashaa
la source
+1 Je n'allais pas entrer dans ces détails (en effet, avec votre réponse couvrant déjà très bien les choses, je n'ajouterai probablement rien à ce que j'ai maintenant) donc si vous voulez mettre plus de détails, ne t retenir mon compte. J'aurais été encore plusieurs jours (et toujours pour moins que vous ne l'avez déjà fait), donc c'est une bonne chose que vous soyez entré.
Glen_b -Reinstate Monica
This is a nice answer particularly for adding in Le Cam's lemma (+1). It seems to me there is quite a big jump between establishing the asymptotics in 1, 2, and 3, and the "therefore" bit where you write the AREs. I think if I were writing this up, I'd define asymptotic efficiency at this point (or maybe earlier, so the upshot of points 1, 2 and 3 would be the AEs not just local asymptotic powers in each case) and then the step to the AREs would be much easier for future readers to follow.
Silverfish
Perhaps it is worth specifying your H1? One-sided and two-sided cases have different-looking asymptotic powers (though they lead to the same AREs).
Silverfish
N'hésitez pas à modifier ma réponse ou à l'ajouter à l'OP.
Khashaa
1
@Khashaa Thanks. I shall edit your post when I have the right stuff in front of me. Would you mind clarifying the meaning of the in the final equation?
Silverfish
6

This has nothing to do with explaining why π appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t-test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t-test is the square of the correlation between the scores used for the two tests. As n the squared correlation converges to π3. You can easily see this empirically using R:

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297
Frank Harrell
la source
This is indeed a very helpful comment. Is it slightly conceptually closer to do n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2 (which obviously produces the same result)?
Silverfish
(People intrigued by Frank's comment may want to look at this question about the equivalence of Wilcoxon-Mann-Whitney U and a t-test on the ranks.)
Silverfish
something I don't understand about this answer is that the correlation is higher for lower values of n (I think the proximal reason is that we don't see the tails very well for smaller n). Naively that implies that the relative efficiency of the Wilcoxon is higher for small n, which surprises me ... ?? (I might do some simulations, but (a) if there's an easy answer ... and (b) am I missing a conceptual point somewhere?)
Ben Bolker
Si je me souviens bien, l'efficacité du petit échantillon du test de rang signé par Wilcoxon et du WMW est un peu inférieure à la valeur asymptotique des alternatives de décalage à la distribution normale.
Glen_b -Reinstate Monica
5

Version courte: La raison fondamentale avec Wilcoxon-Mann-Whitney dans une alternative de décalage est que trouver l'efficacité relative asymptotique (WMW / t) correspond à évaluer 12σ2[F2(X)X]2F est la densité commune au nul et σ est la variance commune.

Donc, à la normale, F2 est en fait une version à l'échelle de F; son intégrale aura un1πterme; au carré, c'est la source duπ.

Le même terme - avec la même intégrale - est impliqué dans l'ARE pour le test de classement signé, il prend donc la même valeur.

Pour le test de signe relatif à t, l'ARE est 4σ2F(0)2... et F(0)2 a encore une π en elle.

Donc, c'est essentiellement comme je l'ai dit dans les commentaires; π est dans l'ARE pour le test de Wilcoxon-Mann-Whitney vs le test t à deux échantillons, pour le test de rang signé Wilcoxon vs le t à un échantillon et le test de signe vs le test t à un échantillon (dans chaque cas à la normale) littéralement parce qu'il apparaît dans la densité normale.

Référence:

JL Hodges et EL Lehmann (1956),
"L'efficacité de certains concurrents non paramétriques du test t",
Ann. Math. Statist. , 27 : 2, 324-335.

Glen_b -Reinstate Monica
la source
I like the explanation for the intuition for the appearance of π in the denominator; is it essentially coincidence that the Renyi entropy turns up in the WMW/Wilcoxon integrals?
Silverfish
@Silverfish That f2dx turns up is certainly not coincidence. However, that's not because that's connected to Rényi entropy, or at least I don't see any direct connection. We're getting into stuff I don't really know about now, though.
Glen_b -Reinstate Monica
@Silverfish It's only a Renyi entropy for α=2. Otherwise, it is just a plain old square that can come up in a million different ways.
abalter