Comment tester les différences entre les médianes de plusieurs éléments Likert?

8

Dans une étude par questionnaire, nous avons demandé aux répondants d'exprimer leurs attitudes à l'égard de la façon dont différents facteurs climatiques hivernaux tels que la neige, la glissance peuvent affecter leur choix de marcher et de se rendre au travail à vélo. L'échantillon composé de 500 individus et réponses était sous forme de 5 échelles de cotation très négative à très positive (échelle ordinale).

Si je veux comparer les réponses à différentes questions, je suppose que la médiane est un outil approprié car les données sont ordinales. Je sais que comparer signifie qu'il existe différents tests statistiques pour montrer si la probabilité de différence est significative (test t ou test non paramétrique ..). Mais je suis un peu confus si je peux utiliser ces tests sur le type de données que j'ai expliqué ici.

  • Existe-t-il des statistiques de test à utiliser pour comparer les médianes?
  • Ou devrais-je transférer les données sur une échelle d'intervalles si cela est approprié?
Saeed
la source

Réponses:

4

Je trouve que la moyenne est un indicateur beaucoup plus utile de la tendance centrale des items de Likert que la médiane. J'ai développé mon argumentation ici sur une question demandant s'il faut utiliser la moyenne ou la médiane pour les éléments similaires .

Un récapitulatif de certaines de ces raisons:

  • La moyenne est plus informative; la médiane est trop brute pour les articles Likert. Par exemple, la médiane de 1 1 3 3 3est la même que 3 3 3 5 5(c.-à-d. 3), mais la moyenne reflète la différence.
  • Les éléments de Likert sont souvent formulés de manière à ce que l'hypothèse de la distance égale entre les catégories soit un point de départ utile.
  • Même si les réponses individuelles sont discrètes, la mesure au niveau du groupe se rapproche de la continuité (avec 500 personnes et une échelle de 5 points, la valeur de votre moyenne pourrait prendre 500 * 4 + 1 = 2001différentes valeurs)
  • Il y a peu d'argument selon lequel un pourcentage est un résumé utile dans les questions de type oui-non (par exemple, vote). C'est juste la moyenne où les réponses ont été codées 0 and 1. Traiter une échelle de 5 points 1 2 3 4 5comme cela me semble presque aussi naturel.
  • D'autres échelles plausibles des éléments de Likert ne changeront probablement pas substantiellement les déductions quant à l'existence de différences entre les moyens (mais vous pouvez le vérifier).

Si vous êtes persuadé que la moyenne est la mesure appropriée de la tendance centrale, alors vous voudrez structurer vos tests d'hypothèse de manière à ce qu'ils testent les différences entre les moyennes. Un test t pour échantillon apparié permettrait une comparaison des moyennes par paire, mais il y aurait des problèmes de précision des valeurs de p étant donné la distribution d'erreur discrète et non normale. Néanmoins, l'adoption d'une approche non paramétrique n'est pas une solution, car elle modifie l'hypothèse.

Je m'attendrais à ce que le test t de l'échantillon apparié soit assez robuste au moins pour l'item typique de Likert, ce qui évite les extrêmes de l'échelle, mais je n'ai pas d'études de simulation à portée de main.

Jeromy Anglim
la source
2

En général, je suis d'accord avec les arguments de Jeromy selon lesquels la moyenne est une statistique raisonnable pour les échelles de Likert. Ce qui pourrait parler pour la médiane, c'est que la médiane est une mesure de localisation beaucoup plus robuste car elle protège contre les valeurs aberrantes (elle a le point de rupture le plus élevé possible de 50%). Cependant, comme les échelles de Likert sont des échelles bornées, la possibilité de valeurs extrêmes extrêmes est très faible (uniquement si vos données sont extrêmement asymétriques). De plus, la médiane est généralement trop coupée à partir des données, vous pouvez donc envisager d'utiliser des moyens coupés à la place. Une quantité de 20% de coupe est généralement recommandée [1].

Si vous voulez calculer un test apparié de la différence des médianes, je recommanderais de comparer les moyennes en utilisant une méthode de bootstrap centile (c'est la seule méthode pour comparer les médianes qui fonctionne bien dans le cas de valeurs liées, voir Wilcox, 2005 [ 1]).

Dans le package WRS pour R, il existe une fonction appelée trimpb2qui effectue ce calcul pour deux échantillons indépendants (vous pouvez également calculer la valeur ap pour les moyennes de coupure avec cette fonction). Dans votre cas, cependant, vous devez comparer les groupes dépendants. Dans ce cas, vous pouvez également utiliser une méthode d'amorçage centile ajustée en biais [2].

Notez, cependant, que la différence des médianes des distributions marginales n'est pas la même que celle de la médiane des scores de différence. Le premier répond à la question «En quoi la réponse typique du premier groupe diffère-t-elle du second» et est effectuée par la fonction WRS rmmcppb. La seconde répond à la question «Quel est le score de différence typique» et est effectuée par la fonction WRS rmmcppbd.

[1] Wilcox, RR (2005). Introduction aux tests robustes d'estimation et d'hypothèse. San Diego: Academic Press.

[2] Wilcox, RR (2006). Comparaisons par paires de groupes dépendants basées sur les médianes. Statistiques computationnelles et analyse des données, 50, 2933-2941. doi: 10.1016 / j.csda.2005.04.017

Felix S
la source
0

Une option pour comparer les médianes est les tests de permutation . Cependant, si vous comparez les réponses à 2 questions qui ont été remplies par le même ensemble de personnes (données jumelées), vous pouvez également consulter le test de McNemar et ses variations.

Pour élargir un peu, l'idée du test de McNemar (et ses extensions) est de regarder une matrice avec le nombre de répondants qui ont choisi les combinaisons, de sorte qu'un individu contribuerait au nombre dans la cellule dont la colonne est déterminée par leur réponse à la question 1 et à la ligne est déterminée par leur réponse à la question 2 (le tableau ou les commandes croisées créent la matrice). Le schéma de cette matrice sera probablement plus informatif qu'une simple moyenne ou médiane. La diagonale représente les personnes qui ont répondu de la même manière aux 2 questions, le triangle supérieur sont ceux qui ont répondu plus haut à la 1ère question qu'à la 2e question, et le triangle inférieur la différence. La distance de la diagonale indique la différence entre les 2 réponses. Les variations du test de McNemar examinent si les nombres dans les 2 triangles sont différents, ou si la matrice est symétrique. Pour prendre en compte la nature ordinale (vs nominale) des données, la distance de la diagonale est prise en compte.

Le simple fait de regarder les modèles dans le tableau peut être suffisant pour vos besoins, mais si vous avez besoin d'un test formel, vous pouvez soit suivre les tests suggérés, soit effectuer une forme de test de permutation (exactement comment cela dépend de ce que vous recherchez ou essayer de montrer).

Greg Snow
la source
3
Le test de McNemar concerne les données nominales. Pour les données ordinales, comme ici, les gens choisissent souvent le test de rang signé Wilcoxon ou le test de signe (mais la puissance de ce dernier a tendance à être faible).
whuber
Le problème avec la question de Saeed est qu'ils exigeaient une comparaison des médianes de distrubutions apparentées et non indépendantes. On peut dire que le test t sur échantillon apparié compare les moyennes , car son numérateur - la moyenne des différences par cas - est la même valeur que la différence entre les deux moyennes. Mais pour la médiane, la médiane des différences par cas n'est pas la même valeur que la différence entre les deux médianes. Je doute donc qu'il existe un test que l'on pourrait appeler exactement "test des médianes pour les échantillons appariés".
ttnphns