Efficacité relative du rang signé de Wilcoxon dans de petits échantillons

9

J'ai vu dans la littérature publiée (et publiée ici) que l'efficacité relative asymptotique du test de rang signé de Wilcoxon est d'au moins 0,864 par rapport au test t. J'ai également entendu dire que cela ne s'applique qu'aux grands échantillons, bien que certains livres ne mentionnent pas cela (qu'est-ce que c'est?).

Quoi qu'il en soit, ma question est de savoir à quel point les choses doivent être réduites avant que le paragraphe ci-dessus ne s'applique plus?

Dans mon cas, j'ai 4 paires de données. Si toutes les hypothèses se vérifient, je sais que j'ai au moins 90% de puissance pour détecter une taille d'effet de 2SD sous le test t apparié si j'utilise un alpha de 0,1 et que j'ai des données moyennement corrélées. Cependant, je voudrais utiliser le test de classement signé Wilcoxon en raison de la petite taille de l'échantillon et de son incapacité à vérifier les hypothèses, mais je crains que le test n'ait trop de puissance si je le fais. Merci!

Jimj
la source
4
"Asymptotique" n'importe quoi dans de "petits échantillons" n'a pas de sens: c'est une contradiction dans les termes. Je suppose que vous demandez l'efficacité relative réelle dans de petits échantillons, point final. La réponse dépend des distributions sous-jacentes que vous comparez et sera donc compliquée à moins que vous n'ayez deux distributions spécifiques en tête. Beaucoup de gens choisissent le Normal comme référence, mais cela ne convient pas nécessairement à vos applications.
whuber
Oui je recherche une efficacité relative dans de petits échantillons. Merci d'avoir fait remarquer cela. Je veux savoir quel est le pire que je puisse faire sur le plan de la puissance. Je n'ai pas vraiment de distributions sous-jacentes en tête, mais si je devais utiliser la normale, comme vous le suggérez, comment procéder? Je sais que cela dépendra également de la corrélation des données.
Jimj
1
Qu'est-ce que les «données moyennement corrélées»?
Glen_b -Reinstate Monica
1
Notez que votre puissance supérieure à 90% sera à la normale, pas à la distribution où ARE est de 0,864. En tant que tel, le calcul doit être fait à la normale.
Glen_b -Reinstate Monica
@ Glen_b: Vous avez raison, je devrais préciser ce que je pensais par corrélation modérée. Je pensais à une corrélation d'au moins 0,4. Alors, comment puis-je faire le calcul? Aussi, en termes de ma question initiale sur la comparaison de l'efficacité des deux tests à de petits échantillons, j'ai fait un peu de recherche sur ce sujet. Quelques sources ont indiqué que la réponse n'est pas complètement claire dans les échantillons plus petits, mais le test de Wilcoxon fonctionne assez bien. Peut-être que je vais devoir vivre avec ce type de réponse pour l'instant.
Jimj

Réponses:

11

Klotz a examiné la petite puissance d'échantillonnage du test de rang signé par rapport à l'échantillon dans le cas normal.t

[Klotz, J. (1963) "Puissance et efficacité des petits échantillons pour les tests de Wilcoxon et des scores normaux à un échantillon" The Annals of Mathematical Statistics , Vol. 34, n ° 2, pp. 624-632]

À et près de (les exacts ne sont bien sûr pas réalisables, à moins que vous ne choisissiez la voie de randomisation, ce que la plupart des gens évitent d'utiliser, et je pense avec raison) l'efficacité relative du à la normale tend à être assez proche de l'ARE là-bas (0,955), bien que la proximité dépend (elle varie avec le décalage moyen et à plus petit , l'efficacité sera plus faible). Pour des échantillons plus petits que 10, l'efficacité est généralement (un peu) plus élevée.n=10α0.1αtα

À et (les deux avec proche de 0,05), l'efficacité était d'environ 0,97 ou plus.n=5n=6α

Donc, en gros ... l'ARE à la normale est une sous-estimation de l'efficacité relative dans le petit cas d'échantillon, tant que n'est pas petit. Je pense que pour un test bilatéral avec votre plus petit réalisable est 0,125. À ce niveau de signification et taille d'échantillon exacts, je pense que l'efficacité relative du sera également élevée (peut-être toujours autour de 0,97-0,98 ou plus) dans la zone où la puissance est intéressante.αn=4αt

Je devrais probablement revenir et parler de la façon de faire une simulation, qui est relativement simple.

Éditer:

Je viens de faire une simulation au niveau 0,125 (car c'est réalisable à cette taille d'échantillon); il semble - à travers une gamme de différences de moyenne, l'efficacité typique est un peu plus faible, pour , plus autour de 0,95-0,97 environ - similaire à la valeur asymptotique.n=4


Mise à jour

Voici un graphique de la puissance (recto-verso) pour le test t (calculé par power.t.test) dans des échantillons normaux, et la puissance simulée pour le test de rang signé Wilcoxon - 40000 simulations par point, avec le test t comme variable de contrôle. L'incertitude sur la position des points est inférieure à un pixel:

courbe de puissance pour t et puissance pour Wilcoxon


Pour rendre cette réponse plus complète, je devrais en fait regarder le comportement du cas pour lequel l'ARE est en fait 0,864 (la bêta (2,2)).

Glen_b -Reinstate Monica
la source