Calculer la moyenne de la variable ordinale

20

J'ai lu à plusieurs endroits que le calcul de la moyenne d'une variable ordinale est inapproprié. J'essaie de comprendre pourquoi cela pourrait être inapproprié. Je pense que c'est parce que, en général, une variable ordinale n'est pas normalement distribuée et donc le calcul de la moyenne donnera une représentation inexacte. Quelqu'un pourrait-il expliquer plus en détail pourquoi le calcul de la moyenne d'une variable ordinale pourrait être inapproprié?

luciano
la source
8
Pour calculer une moyenne, vous avez d'abord besoin d'une somme. Pour qu'une somme soit significative, vous avez besoin que 4 + 2 soit identique à 3 + 3; de manière équivalente, vous avez besoin de 4-3 = 3-2 = 2-1. Avec des données ordinales - même lorsque ses catégories sont étiquetées "1", "2", "3", "4" - ce n'est (tout à fait explicitement) pas nécessairement le cas.
Glen_b -Reinstate Monica
Et pourquoi la médiane serait-elle plus appropriée que la moyenne arithmétique?

Réponses:

24

Une réponse courte est que c'est controversé. Contrairement aux conseils que vous mentionnez, les gens dans de nombreux domaines utilisent des échelles ordinales et sont souvent heureux que cela signifie qu'ils font ce qu'ils veulent. Les moyennes en points ou l'équivalent dans de nombreux systèmes éducatifs en sont un exemple.

Cependant, les données ordinales qui ne sont pas normalement distribuées ne sont pas une raison valable, car la moyenne est

  • largement utilisé pour les distributions non normales

  • bien défini mathématiquement pour de très nombreuses distributions non normales, sauf dans certains cas pathologiques.

Ce n'est peut-être pas une bonne idée d'utiliser la moyenne dans la pratique si les données ne sont certainement pas distribuées normalement, mais c'est différent.

Une raison plus importante pour ne pas utiliser la moyenne avec des données ordinales est que sa valeur dépend des conventions de codage. Les codes numériques tels que 1, 2, 3, 4 sont généralement choisis simplement pour des raisons de simplicité ou de commodité, mais en principe, ils pourraient tout aussi bien être 1, 23, 456, 7890 dans la mesure où ils correspondent à un ordre défini. Prendre la moyenne dans les deux cas impliquerait de prendre ces conventions à la lettre (à savoir, comme si les chiffres n'étaient pas arbitraires, mais justifiables), et il n'y a pas de motif rigoureux pour le faire. Vous avez besoin d'une échelle d'intervalle dans laquelle des différences égales entre les valeurs peuvent être prises littéralement pour justifier la prise de moyennes. C'est ce que je considère comme l'argument principal, mais comme déjà indiqué, les gens l'ignorent souvent et délibérément, car ils trouvent les moyens utiles, quoi qu'en disent les théoriciens de la mesure.

Voici un exemple supplémentaire. Souvent, les gens sont invités à choisir l'un des "fortement en désaccord" ... "fortement d'accord" et (selon en partie ce que le logiciel veut) les chercheurs codent cela comme 1 .. 5 ou 0 .. 4 ou tout ce qu'ils veulent, ou le déclarer comme facteur ordonné (ou quel que soit le terme utilisé par le logiciel). Ici, le codage est arbitraire et caché aux personnes qui répondent à la question.

Mais souvent, on demande aussi aux gens sur une échelle de 1 à 5, comment évaluez-vous quelque chose? Les exemples abondent: sites Web, sports, autres types de compétitions et même éducation. Ici, on montre aux gens une échelle et on lui demande de l'utiliser. Il est largement admis que les non-entiers ont un sens, mais vous êtes simplement autorisé à utiliser des entiers comme convention. Est-ce une échelle ordinale? Certains disent oui, certains disent non. Autrement dit, une partie du problème est que ce qui est échelle ordinale est lui-même une zone floue ou débattue.

Considérez à nouveau les notes pour le travail académique, dites E à A. Souvent, ces notes sont également traitées numériquement, disons de 1 à 5, et les gens calculent régulièrement des moyennes pour les étudiants, les cours, les écoles, etc. et effectuent de nouvelles analyses de ces données. S'il est vrai que tout mappage avec des scores numériques est arbitraire mais acceptable tant qu'il préserve l'ordre, néanmoins dans la pratique, les personnes attribuant et recevant les notes savent que les scores ont des équivalents numériques et savent que les notes seront moyennées .

Une raison pragmatique d'utiliser des moyens est que les médianes et les modes sont souvent de mauvais résumés des informations contenues dans les données. Supposons que vous ayez une échelle allant de fortement en désaccord à fortement d'accord et pour des raisons de commodité, codez les points 1 à 5. Imaginez maintenant un échantillon codé 1, 1, 2, 2, 2 et un autre 1, 2, 2, 4, 5. Maintenant, augmentez vos mains si vous pensez que la médiane et le mode sont les seuls résumés justifiables car c'est une échelle ordinale. Maintenant, levez la main si vous trouvez la moyenne également utile, que les sommes soient bien définies, etc.

Naturellement, la moyenne serait un résumé hypersensible si les codes étaient des carrés ou des cubes de 1 à 5, disons, et ce n'est peut-être pas ce que vous voulez. (Si votre objectif est d'identifier rapidement les hauts voleurs, cela pourrait être exactement ce que vous voulez!) Mais c'est précisément pourquoi le codage conventionnel avec des codes entiers successifs est un choix pratique, car il fonctionne souvent très bien en pratique. Ce n'est pas un argument qui a du poids auprès des théoriciens de la mesure, et cela ne devrait pas non plus, mais les analystes de données devraient être intéressés à produire des résumés riches en informations.

Je suis d'accord avec tous ceux qui disent: utilisez toute la distribution des fréquences de notes, mais ce n'est pas le problème.

Nick Cox
la source
1
Une bonne réponse et un pragmatisme sont importants, mais j'ajouterais une note de prudence. Une bonne raison de n'utiliser que des méthodes formellement établies est que vous avez accès à des estimations de certitude, etc. Par exemple, si nous avons deux GPA, disons 4.53 et 4.34, nous pouvons vouloir savoir si l'un est "significativement" meilleur que l'autre. Mais en raison du manque de formalité dans la moyenne des notes, nous n'obtenons pas des choses comme les intervalles de confiance, etc.
Stephen McAteer
1
@StephenMcAteer Je vois votre point en termes de méthodes enseignées dans un texte ou un cours d'introduction typique. Mais si tel était le souhait, le bootstrap a fourni une technologie permettant des intervalles de confiance depuis près de 40 ans maintenant.
Nick Cox
3

Supposons que nous prenons des valeurs ordinales, par exemple 1 pour fortement en désaccord, 2 pour en désaccord, 3 pour d'accord et 4 pour fortement d'accord. Si quatre personnes donnent les réponses 1, 2, 3 et 4, quelle serait alors la moyenne? C'est (1 + 2 + 3 + 4) /4=2.50.

Comment interpréter cela, lorsque la réponse moyenne de quatre personnes est «en désaccord ou en accord»? C'est pourquoi nous ne devrions pas utiliser la moyenne pour les données ordinales.

SAAN
la source
3
Jouant un peu l'avocat du diable, dans cet exemple, j'interpréterais 2.5 comme étant à mi-chemin entre 2, "en désaccord" et 3, "d'accord". Cela a du sens en tant que moyenne étant donné que nous avons «fortement en désaccord» vs «fortement d'accord» et «en désaccord» vs «d'accord».
TooTone
1
Dans ce contexte, un accord sur une moyenne de 2,5 a toujours du sens pour moi - à mi-chemin entre un désaccord et un accord, ou en d'autres termes, neutre.
luciano
3
Je pense qu'Azeem a besoin d'un exemple plus fort. Vous pourriez vous opposer à 2,5 comme la moyenne de 1, 2, 3, 4 enfants par famille pour les mêmes motifs, comment cela doit-il être interprété car il ne s'agit pas d'une des valeurs définies. Cela soulève différents problèmes.
Nick Cox
2
Je pense que vous pouvez renforcer votre réponse et je vous encourage à le faire. «parce que la moyenne peut être une valeur indéfinie» n'est pas un argument solide ici, logiquement ou psychologiquement, et ne se concentre pas sur la question plus profonde de savoir si des différences égales signifient vraiment des différences égales.
Nick Cox
1
Je ne sais pas comment je peux le rendre plus clair, mais (par exemple) "0-4", "5-19", "20-114" sont ordonnés (ordinaux) en ce qu'il n'y a qu'un seul ordre naturel à ces mesures (à court d'inversion). Si vous voulez les appeler aussi d'autres choses, ça me va.
Nick Cox
2

Je suis totalement d'accord avec @Azeem. Mais juste pour ramener ce point à la maison, laissez-moi développer un peu plus.

Supposons que vous ayez des données ordinales comme dans l'exemple de @Azeem, où votre échelle varie de 1 à 4. Et disons également que quelques personnes évaluent quelque chose (comme la crème glacée) sur cette échelle. Imaginez que vous obtenez les résultats suivants:

  • La personne A a dit 4
  • La personne B a dit 3
  • La personne C a dit 1
  • La personne D a dit 2

Lorsque vous souhaitez interpréter les résultats, vous pouvez conclure quelque chose dans la mesure de:

  • La personne A aimait la crème glacée plus que la personne B
  • La personne D aimait la crème glacée plus que la personne C

Cependant, vous ne savez rien des intervalles entre les évaluations. La différence entre 1 et 2 est-elle la même que celle entre 3 et 4? Une note de 4 signifie-t-elle vraiment que la personne aime la crème glacée 4 fois plus que quelqu'un qui la note 1? Et ainsi de suite ... Lorsque vous calculez la moyenne arithmétique, vous traitez les nombres comme si les différences entre eux étaient égales. Mais c'est une hypothèse assez forte avec des données ordinales et vous devrez la justifier.

Jens Kouros
la source
J'ai supprimé la référence à la réponse ci-dessus. Les réponses peuvent changer l'ordre et en fait la réponse qui était au-dessus est à ce moment ci-dessous, et cela peut changer. Faites donc des renvois aux affiches, pas à la position.
Nick Cox
0

Je suis d'accord avec le concept selon lequel la moyenne arithmétique ne peut pas être vraiment justifiée dans les données à l'échelle ordinale. Au lieu de calculer la moyenne, nous pouvons utiliser le mode ou la médiane dans de telles situations, ce qui peut nous donner une interprétation plus significative de nos résultats.

ayaz
la source
Cela ne règle pas la question de savoir pourquoi cela pourrait être inapproprié.
Nick Cox