Affichage des données ordinales - moyennes, médianes et rangs moyens

11

J'ai des données ordinales qui ne sont pas normalement distribuées, j'ai donc décidé de faire des tests non paramétriques en utilisant le test U de Mann-Whitney. Je regarde les différences entre les groupes pour sept scores - ces scores sont soit 0, 1, 2 ou 3 pour chaque sujet. J'ai du mal à trouver comment afficher mes données!

Si je présente les données en utilisant les médianes (et l'IQR des médianes), on ne sait pas du tout où sont les différences car, pour la plupart, les médianes tombent sur 0 ou 1. Donc, malgré le test U de Mann-Whitney montrant des différences significatives, la table semble juste inintéressante.

Je pourrais également présenter les données en utilisant les moyens . Il existe des articles scientifiques qui disent que vous pouvez utiliser des moyens avec des données ordinales, mais que vous ne pouvez pas faire le même type d'hypothèses sur les différences entre les scores (par exemple, la différence entre 0 et 1 n'est pas la même qu'entre 1 et 2). L'utilisation de moyens serait un peu controversée, bien que les chiffres du tableau racontent bien l'histoire lorsque je les utilise.

Une troisième option consiste à utiliser les rangs moyens que SPSS me donne dans la sortie du Mann-Whitney. Les rangs moyens sont ce qui est comparé entre les groupes, alors peut-être que je devrais simplement les utiliser? Le seul problème que j'ai avec cela est que les classements moyens ne signifient vraiment rien en ce qui concerne les données réelles (par exemple, je ne peux pas voir que les sujets sont plus proches de 3 tandis que les contrôles sont plus proches de 1 en utilisant les classements moyens.)

Et une dernière option consistait à effectuer une analyse du chi carré comparant les sujets et les contrôles après avoir divisé les scores en deux groupes (0 et 1 pour faible et 2 et 3 pour élevé). Cependant, quand je l'ai fait, les différences n'étaient pas aussi prononcées (probablement pour un certain nombre de raisons).

Eric
la source
Vous demandez-vous comment présenter au mieux vos données sous forme de texte, de tableau ou de figure?
gung - Reinstate Monica
Texte et tableau. Dans le texte, je vais dire qu'il y avait des différences significatives entre les groupes sur plusieurs composantes de mon enquête sur le sommeil. Ces différences sont via un test de Mann-Whitney, donc ils comparent les rangs moyens. Ce que je ne sais pas, c'est comment présenter ces différences dans un tableau. L'utilisation de médianes ne fonctionne pas car elles sont beaucoup trop similaires et vous ne pouvez pas voir les différences. Les moyens fonctionnent mieux, mais il semble étrange d'utiliser des mesures paramétriques dans un tableau qui devrait concerner les médianes non paramétriques. Et les rangs moyens fonctionneraient, mais ils ne représentent pas les valeurs réelles.
Eric
1
Je me demande si certaines réponses de Graph pour la relation entre deux variables ordinales pourraient être adaptées à vos besoins? Les graphiques d'exemple montrent la relation entre deux variables ayant chacune cinq niveaux, mais si vous comparez, par exemple, deux groupes et que vous avez quatre niveaux possibles, vous pouvez réimaginer certaines de ces visualisations en 4 par 2 au lieu de 5 par. 5, peut-être.
Silverfish
Il pourrait être utile de publier des exemples de données (peut-être entièrement fausses), afin que les personnes qui souhaitent démontrer une technique possible aient quelque chose à travailler.
Silverfish
1
Eric, par définition, un test non paramétrique, Mann-Whitney en particulier, compare (pour la dominance) deux distributions en général, il ne compare pas une valeur de paramètre spécifique d'une distribution, telle que la moyenne ou la médiane. Il n'existe pas de numéro unique qui soit caractéristique d'une distribution et en même temps ce qui est comparé, dans ce cas. Vous pouvez utiliser l'estimateur à 2 échantillons de Hodges-Lehmann, mais c'est la caractéristique de la différence entre deux distributions et non de chacune des deux distributions.
ttnphns

Réponses:

8

1,2,=3

La justesse de l'utilisation de la moyenne pour résumer les variables ordinales peut rarement provenir des données elles-mêmes. C'est subjectif.

Dxyγxy

Frank Harrell
la source
1
Salut Frank, merci pour votre réponse réfléchie. Si cela ne vous dérange pas, j'ai quelques questions de suivi. En ce qui concerne les moyens - je pense que les catégories ont au moins un sens à mi-chemin, car elles se réfèrent essentiellement à "aucune déficience légère, modérée et sévère", respectivement. Y a-t-il des références que vous connaissez que je pourrais utiliser comme précédent pour cela? J'hésite également à utiliser les moyens dans un seul tableau et les médianes dans d'autres pour des raisons de cohérence. ET pour les rangs moyens - je crois que je compare les groupes - sujets vs témoins sur 7 scores. La comparaison des classements moyens est-elle acceptable / utile?
Eric
Pour les données ordinales numériques avec peu de niveaux, comme les nombres et peut-être votre exemple de déficience, les moyennes sont utiles et les médianes ne le sont pas (en raison de trop de liens). Il y a de nombreuses occasions où j'ai utilisé des moyennes pour les données ordinales et des médianes pour les données continues asymétriques, dans le même tableau.
Frank Harrell