J'ai vu dans la littérature publiée (et publiée ici) que l'efficacité relative asymptotique du test de rang signé de Wilcoxon est d'au moins 0,864 par rapport au test t. J'ai également entendu dire que cela ne s'applique qu'aux grands échantillons, bien que certains livres ne mentionnent pas cela (qu'est-ce que c'est?).
Quoi qu'il en soit, ma question est de savoir à quel point les choses doivent être réduites avant que le paragraphe ci-dessus ne s'applique plus?
Dans mon cas, j'ai 4 paires de données. Si toutes les hypothèses se vérifient, je sais que j'ai au moins 90% de puissance pour détecter une taille d'effet de 2SD sous le test t apparié si j'utilise un alpha de 0,1 et que j'ai des données moyennement corrélées. Cependant, je voudrais utiliser le test de classement signé Wilcoxon en raison de la petite taille de l'échantillon et de son incapacité à vérifier les hypothèses, mais je crains que le test n'ait trop de puissance si je le fais. Merci!
Réponses:
Klotz a examiné la petite puissance d'échantillonnage du test de rang signé par rapport à l'échantillon dans le cas normal.t
[Klotz, J. (1963) "Puissance et efficacité des petits échantillons pour les tests de Wilcoxon et des scores normaux à un échantillon" The Annals of Mathematical Statistics , Vol. 34, n ° 2, pp. 624-632]
À et près de (les exacts ne sont bien sûr pas réalisables, à moins que vous ne choisissiez la voie de randomisation, ce que la plupart des gens évitent d'utiliser, et je pense avec raison) l'efficacité relative du à la normale tend à être assez proche de l'ARE là-bas (0,955), bien que la proximité dépend (elle varie avec le décalage moyen et à plus petit , l'efficacité sera plus faible). Pour des échantillons plus petits que 10, l'efficacité est généralement (un peu) plus élevée.n=10 α 0.1 α t α
À et (les deux avec proche de 0,05), l'efficacité était d'environ 0,97 ou plus.n=5 n=6 α
Donc, en gros ... l'ARE à la normale est une sous-estimation de l'efficacité relative dans le petit cas d'échantillon, tant que n'est pas petit. Je pense que pour un test bilatéral avec votre plus petit réalisable est 0,125. À ce niveau de signification et taille d'échantillon exacts, je pense que l'efficacité relative du sera également élevée (peut-être toujours autour de 0,97-0,98 ou plus) dans la zone où la puissance est intéressante.α n=4 α t
Je devrais probablement revenir et parler de la façon de faire une simulation, qui est relativement simple.
Éditer:
Je viens de faire une simulation au niveau 0,125 (car c'est réalisable à cette taille d'échantillon); il semble - à travers une gamme de différences de moyenne, l'efficacité typique est un peu plus faible, pour , plus autour de 0,95-0,97 environ - similaire à la valeur asymptotique.n=4
Mise à jour
Voici un graphique de la puissance (recto-verso) pour le test t (calculé par
power.t.test
) dans des échantillons normaux, et la puissance simulée pour le test de rang signé Wilcoxon - 40000 simulations par point, avec le test t comme variable de contrôle. L'incertitude sur la position des points est inférieure à un pixel:Pour rendre cette réponse plus complète, je devrais en fait regarder le comportement du cas pour lequel l'ARE est en fait 0,864 (la bêta (2,2)).
la source