Différence entre le test de somme de rang Wilcoxon et le test de rang signé Wilcoxon

22

Je me demandais quelle était la différence théorique entre le Wilcoxon Rank-Sum Test et le Wilcoxon Signed-Rank Test en utilisant des observations appariées. Je sais que le test de Wilcoxon Rank-Sum permet différentes quantités d'observations dans deux échantillons différents, alors que le test Signed-Rank pour les échantillons appariés ne le permet pas, mais ils semblent tous deux tester la même chose à mon avis. Quelqu'un peut-il me donner des informations plus générales / théoriques sur le moment où l'on devrait utiliser le test de Wilcoxon Rank-Sum et quand on devrait utiliser le test de Wilcoxon Signed-Rank en utilisant des observations par paires?

Flocon de neige
la source

Réponses:

25

Vous devez utiliser le test de classement signé lorsque les données sont couplées .

Vous trouverez de nombreuses définitions de l'appariement, mais au fond, le critère est quelque chose qui rend les paires de valeurs au moins quelque peu positivement dépendantes, tandis que les valeurs non appariées ne sont pas dépendantes. Souvent, l'appariement de dépendance se produit parce que ce sont des observations sur la même unité (mesures répétées), mais il n'est pas nécessaire que ce soit sur la même unité, juste en quelque sorte tendant à être associé (tout en mesurant le même genre de chose) , à considérer comme «jumelé».

Vous devez utiliser le test de somme de classement lorsque les données ne sont pas appariées.

C'est tout ce qu'il y a à faire.

Notez que le fait d'avoir le même ne signifie pas que les données sont appariées et que différent ne signifie pas qu'il n'y a pas d'appariement (il se peut que quelques paires aient perdu une observation pour une raison quelconque). L'appariement vient de la considération de ce qui a été échantillonné.nn

L'utilisation d'un test couplé lorsque les données sont couplées a pour effet de donner généralement plus de pouvoir pour détecter les changements qui vous intéressent. Si l'association conduit à une forte dépendance *, alors le gain de puissance peut être substantiel.

* en particulier, mais de façon assez vague, si la taille de l'effet est grande par rapport à la taille typique des différences de paire, mais petite par rapport à la taille typique des différences non appariées, vous pouvez ramasser la différence avec un test couplé à un taille d'échantillon assez petite mais avec un test non apparié uniquement à une taille d'échantillon beaucoup plus grande.

Cependant, lorsque les données ne sont pas appariées, il peut être (au moins légèrement) contre-productif de traiter les données comme appariées. Cela dit, le coût - en perte de puissance - peut dans de nombreuses circonstances être assez faible - une étude de puissance que j'ai faite en réponse à cette question semble suggérer qu'en moyenne la perte de puissance dans des situations typiques de petit échantillon (disons pour n de la commande) de 10 à 30 dans chaque échantillon, après ajustement pour les différences de niveau de signification) peut être étonnamment faible.

[Si vous ne savez pas vraiment si les données sont appariées ou non, la perte de traitement des données non appariées comme appariées est généralement relativement mineure, tandis que les gains peuvent être substantiels s'ils sont appariés. Cela suggère que si vous ne le savez vraiment pas et que vous avez un moyen de déterminer ce qui est couplé avec ce qui suppose qu'ils ont été couplés - tels que les valeurs se trouvant dans la même ligne dans un tableau, il peut en pratique être judicieux d'agir comme si les données étaient appariées pour être en sécurité - bien que certaines personnes aient tendance à être assez exercées à ce sujet.]

Glen_b -Reinstate Monica
la source
7

Je ne suis pas chercheur, je suis cependant majeur en statistique. Je vais d'abord mettre en page les exigences pour le test de somme de rang signé Wilcoxon (WSRST).

  • Le WSRST exige que les populations soient appariées, par exemple, le même groupe de personnes est testé à deux occasions ou choses différentes et MESURÉ sur les effets de chacune et nous comparons ensuite les deux choses ou occasions.
  • Le WSRST exige que les données soient quantitatives. Les données quantitatives sont des données mesurées le long d'une échelle, c'est pourquoi j'ai mis en évidence le monde mesuré au premier point. Si les participants avaient été invités à classer leurs réponses, vous aurez alors affaire à des données qualitatives, où vous devrez alors utiliser le test des signes pour tester votre hypothèse.

[Il existe d'autres exigences pour le WSRST mais celles que j'ai énumérées sont suffisantes pour différencier les deux tests]

Maintenant le Wilcoxon Rank Sum Test (WRST)

  • La principale exigence est que les échantillons soient prélevés sur des populations indépendantes. Par exemple, vous voudrez peut-être tester si le papier d'examen 1 est plus dur que le papier d'examen 2, et pour ce faire, vous aurez deux groupes d'étudiants, et les groupes n'ont pas besoin d'être de la même taille. D'après l'exemple, les deux groupes sont indépendants, si vous aviez demandé au même groupe d'écrire deux fois le même papier, vous utiliserez le WSRST pour tester votre hypothèse.
  • L'autre condition est que les données ne doivent pas être quantitatives, c'est-à-dire que vous pouvez également effectuer le test sur des données qualitatives.
S'busiso
la source