Dans quelle situation le test de classement signé de Wilcoxon serait-il préférable au test t ou au test de signe?

10

Après une discussion (ci-dessous), j'ai maintenant une image plus claire d'une question ciblée, donc voici une question révisée, bien que certains des commentaires puissent maintenant sembler sans rapport avec la question d'origine.

Il semble que les tests t convergent rapidement pour les distributions symétriques , que le test de rang signé suppose la symétrie et que, pour une distribution symétrique, il n'y a pas de différence entre les moyennes / pseudomédiens / médianes. Dans l'affirmative, dans quelles circonstances un statisticien relativement inexpérimenté trouverait-il utile le test de rang signé, alors qu'il dispose à la fois du test t et du test de signe? Si l'un de mes étudiants (par exemple en sciences sociales) essaie de tester si un traitement est plus performant qu'un autre (par une mesure relativement facile à interpréter, par exemple une notion de différence "moyenne"), j'ai du mal à trouver une place pour la signature. test de classement, même s'il semble généralement enseigné, et le test de signe ignoré, dans mon université.

juste moi
la source
1
Justme: bien sûr, je n'y ai pas pensé.
JonB
1
Cela dépend de qui la sagesse conventionnelle que vous regardez; mon expérience est très différente de la vôtre. Il est certainement facile de trouver des ressources qui indiquent clairement que la symétrie des scores de différence est supposée sous la valeur nulle (et que cela compte). Mais notez que cela est inférieur à zéro - en conséquence, trouver un manque de symétrie dans les scores de différence dans un échantillon n'est pas nécessairement pertinent - vous n'êtes pas obligé d'avoir une symétrie dans l'alternative. Si vous êtes très confiant que si la valeur nulle était vraie, la symétrie tiendrait - et dans de nombreux cas, c'est une hypothèse hautement plausible - ... ctd
Glen_b -Reinstate Monica
1
ctd ... alors il n'y a pas de problème. Le problème est que si vous n'êtes pas prêt à l'assumer au préalable, vous ne savez pas si un rejet a été causé par l'échec de l'hypothèse; la chose évidente à faire est alors simplement de ne pas l' assumer.
Glen_b -Reinstate Monica
2
En regardant d'abord votre deuxième commentaire: (en plus de ce que vous avez déjà mentionné), notez que 1. les hypothèses normales n'épuisent pas les tests paramétriques. 2. Le test de classement signé n'est pas en fait un test de médianes mais de statistiques / pseudomédiens Hodges-Lehmann à échantillon unique (bien que si vous ajoutez l'hypothèse de symétrie à l'alternative, il testera également les médianes et, s'il existe des moyens, aussi pour les moyens, entre autres choses). De même, le test de somme de rang n'est pas un test des médianes mais des différences médianes par paire. Vous avez raison de dire que le niveau du test de classement signé peut être assez sensible à l'asymétrie.
Glen_b -Reinstate Monica
2
Sur votre commentaire précédent: 1 La symétrie n'est généralement pas considérée comme faisant partie du null, mais comme faisant partie des hypothèses dont vous avez besoin pour que les permutations soient échangeables sous le null. 2. comme mentionné précédemment, ce n'est pas en fait un test de médianes, mais de pseudomédiens, et cela reste vrai même sous une alternative asymétrique. Il est vrai que l'interprétation est parfois plus facile si vous faites des hypothèses restrictives, mais les restrictions requises pour en faire un test raisonnable des médianes ne doivent pas être aussi strictes que l'hypothèse d'une symétrie dans l'alternative.
Glen_b -Reinstate Monica

Réponses:

3

Considérez une distribution des différences de paires qui est un peu plus lourde que la normale, mais pas spécialement "pointue"; alors souvent, le test de classement signé aura tendance à être plus puissant que le test t, mais aussi plus puissant que le test de signe.

Par exemple, à la distribution logistique, l'efficacité relative asymptotique du test de rang signé par rapport au test t est de 1,097, donc le test de rang signé devrait être plus puissant que le t (au moins dans les échantillons plus grands), mais l'efficacité relative asymptotique du test de signe par rapport au test t est de 0,822, donc le test de signe serait moins puissant que le t (là encore, au moins dans les échantillons plus grands).

À mesure que nous nous dirigeons vers des distributions plus lourdes (tout en évitant celles trop pointues), le t aura tendance à fonctionner relativement moins bien, tandis que le test de signe devrait s'améliorer quelque peu, et le signe et le rang signé surpasseront le t pour détecter les petits effets par des marges substantielles (c'est-à-dire qu'il faudra des échantillons beaucoup plus petits pour détecter un effet). Il y aura une grande classe de distributions pour lesquelles le test de rang signé est le meilleur des trois.

Voici un exemple - la distribution . La puissance a été simulée à n = 100 pour les trois tests, pour un niveau de signification de 5%. La puissance du test est marquée en noir, celle du Wilcoxon est signée en rouge et le test du signe est marqué en vert. Les niveaux de signification disponibles du test de signe ne comprenaient pas spécialement près de 5%, dans ce cas, un test randomisé a été utilisé pour se rapprocher du bon niveau de signification. L'axe des x est le paramètre qui représente le décalage par rapport au cas nul (les tests étaient tous bilatéraux, donc la courbe de puissance réelle serait symétrique autour de 0). t δt3tδ

tracé des courbes de puissance pour le t, Wilcoxon a signé des tests de rang et de signe avec n = 100 et un niveau de signification de 5% pour le t3

Comme nous le voyons dans l'intrigue, le test de rang signé a plus de puissance que le test de signe, qui à son tour a plus de puissance que le test t.

Glen_b -Reinstate Monica
la source
Merci beaucoup pour ce @Glen_b! J'ai toujours du mal à trouver où cela se situe dans notre programme, lorsque nous avons des étudiants pour qui même le concept de pouvoir dépasse le cadre de leurs études, et pourquoi nous enseignons Wilcoxon comme l'alternative principale au t apparié. Mais cela donne des motivations utiles. Je vous remercie!
justme
Soit dit en passant, après avoir examiné la caractéristique de distribution qui influe sur la variance asymptotique de la médiane (et donc la puissance du test de signe), un exemple m'est venu où les positions relatives du test t et du signe sont inversées; par conséquent, je pense qu'il y a une bonne possibilité de construire un cas où le test de classement signé peut faire beaucoup mieux que l'un des deux autres tests. Je jouerai encore avec quand je pourrai et peut-être y écrirai quelque chose.
Glen_b -Reinstate Monica
En ce qui concerne votre programme, il est clair qu'il y a certainement des cas où le classement signé surpasse les deux autres tests (comme je l'ai souligné dans mes réponses - des distributions qui sont un peu plus lourdes que la normale, mais pas spécialement en pointe); le t est meilleur à la normale ou plus léger, et le test de signe est meilleur lorsque la distribution a un fort pic (qui a souvent tendance à aller de pair avec des queues très lourdes, mais pas nécessairement). [Attention, cependant, à confondre ces idées avec de simples changements de propagation, ce qui ne modifie pas leurs propriétés relatives.] ... Je suis sûr que vous pourriez
insérer
Merci beaucoup @Glen_b! Le problème est que je n'enseigne pas le programme, je le soutiens simplement! Le programme dans la plupart des départements semble être: (i) utiliser un test d'hypothèse de normalité (tuez-moi maintenant) et basé sur cela (ii) soit utiliser Wilcoxon ou t-Test. Ainsi, les moindres détails des épaules de la distribution, etc. ne sont même jamais touchés, et le pouvoir non plus, juste si les hypothèses sont remplies (de manière légèrement détraquée). Mais vos pensées sont très utiles pour moi personnellement, au moins!
justme
Great post @Glen_b! Donc, en termes de sélection parmi les deux tests, puis-je conclure que nous devons toujours calculer la puissance en premier? Plutôt que de suivre l'hypothèse qui utilise toujours le test de signe si la distribution des différences n'est pas normale? Merci!
Lumos