Vous devez utiliser le test de classement signé lorsque les données sont couplées .
Vous trouverez de nombreuses définitions de l'appariement, mais au fond, le critère est quelque chose qui rend les paires de valeurs au moins quelque peu positivement dépendantes, tandis que les valeurs non appariées ne sont pas dépendantes. Souvent, l'appariement de dépendance se produit parce que ce sont des observations sur la même unité (mesures répétées), mais il n'est pas nécessaire que ce soit sur la même unité, juste en quelque sorte tendant à être associé (tout en mesurant le même genre de chose) , à considérer comme «jumelé».
Vous devez utiliser le test de somme de classement lorsque les données ne sont pas appariées.
C'est tout ce qu'il y a à faire.
Notez que le fait d'avoir le même ne signifie pas que les données sont appariées et que différent ne signifie pas qu'il n'y a pas d'appariement (il se peut que quelques paires aient perdu une observation pour une raison quelconque). L'appariement vient de la considération de ce qui a été échantillonné.nn
L'utilisation d'un test couplé lorsque les données sont couplées a pour effet de donner généralement plus de pouvoir pour détecter les changements qui vous intéressent. Si l'association conduit à une forte dépendance *, alors le gain de puissance peut être substantiel.
* en particulier, mais de façon assez vague, si la taille de l'effet est grande par rapport à la taille typique des différences de paire, mais petite par rapport à la taille typique des différences non appariées, vous pouvez ramasser la différence avec un test couplé à un taille d'échantillon assez petite mais avec un test non apparié uniquement à une taille d'échantillon beaucoup plus grande.
Cependant, lorsque les données ne sont pas appariées, il peut être (au moins légèrement) contre-productif de traiter les données comme appariées. Cela dit, le coût - en perte de puissance - peut dans de nombreuses circonstances être assez faible - une étude de puissance que j'ai faite en réponse à cette question semble suggérer qu'en moyenne la perte de puissance dans des situations typiques de petit échantillon (disons pour n de la commande) de 10 à 30 dans chaque échantillon, après ajustement pour les différences de niveau de signification) peut être étonnamment faible.
[Si vous ne savez pas vraiment si les données sont appariées ou non, la perte de traitement des données non appariées comme appariées est généralement relativement mineure, tandis que les gains peuvent être substantiels s'ils sont appariés. Cela suggère que si vous ne le savez vraiment pas et que vous avez un moyen de déterminer ce qui est couplé avec ce qui suppose qu'ils ont été couplés - tels que les valeurs se trouvant dans la même ligne dans un tableau, il peut en pratique être judicieux d'agir comme si les données étaient appariées pour être en sécurité - bien que certaines personnes aient tendance à être assez exercées à ce sujet.]