J'ai quelques données ordinales obtenues à partir de questions d'enquête. Dans mon cas, ce sont des réponses de type Likert (fortement en désaccord - en désaccord - neutre - en accord - en parfait accord). Dans mes données, ils sont codés 1-5.
Je ne pense pas que les moyens signifient beaucoup ici, alors quelles statistiques sommaires de base sont considérées utiles?
descriptive-statistics
likert
ordinal-data
PaulHurleyuk
la source
la source
Réponses:
Une table de fréquences est un bon point de départ. Vous pouvez faire le compte et la fréquence relative pour chaque niveau. En outre, le nombre total et le nombre de valeurs manquantes peuvent être utiles.
Vous pouvez également utiliser un tableau de contingence pour comparer deux variables à la fois. Peut afficher en utilisant un tracé de mosaïque aussi.
la source
Je vais faire valoir d'un point de vue appliqué que la moyenne est souvent le meilleur choix pour résumer la tendance centrale d'un élément de Likert. En particulier, je pense à des contextes tels que les enquêtes de satisfaction des étudiants, les échelles d’études de marché, les enquêtes d’opinion des employés, les tests de personnalité et de nombreux éléments d’enquêtes en sciences sociales.
Dans de tels contextes, les consommateurs de recherche veulent souvent des réponses à des questions telles que:
À ces fins, la moyenne présente plusieurs avantages:
1. La moyenne est facile à calculer:
2. La moyenne est relativement bien comprise et intuitive:
0, 0, 0, 1, 1
codage.3. La moyenne est un nombre unique:
4. Cela ne fait pas beaucoup de différence
la source
En ce qui concerne les résumés de base, je conviens que les tableaux de fréquence de notification et certaines indications sur la tendance centrale sont satisfaisants À titre de déduction, un article récent publié dans PARE traitait du test t vs MWW, des éléments de Likert à cinq points: test t versus Mann-Whitney-Wilcoxon .
Pour un traitement plus élaboré, je recommanderais de lire la critique d’Agresti sur les variables catégorielles ordonnées:
Il va largement au-delà des statistiques habituelles, comme le modèle basé sur des seuils (par exemple, le rapport de cotes proportionnel), et mérite d'être lu à la place du livre CDA d'Agresti .
Ci-dessous, je montre une image de trois façons différentes de traiter un article Likert; de haut en bas, la vue "fréquence" (nominale), la vue "numérique" et la vue "probabiliste" ( modèle de crédit partiel ):
Les données proviennent des
Science
données dultm
paquet, dans lesquelles l'élément concerné concernait la technologie ("Les nouvelles technologies ne dépendent pas de la recherche scientifique fondamentale", avec une réponse "totalement en désaccord" sur "fortement d'accord", sur une échelle de quatre points)la source
La pratique conventionnelle consiste à utiliser la somme et le rang moyen des statistiques non paramétriques pour décrire les données ordinales.
Voici comment ils fonctionnent:
Rank Sum
attribuer un rang à chaque membre de chaque groupe;
Par exemple, supposons que vous cherchiez des buts pour chaque joueur de deux équipes de football adverses, puis que chaque membre des deux équipes soit classé dans l'ordre des buts ;
calculer la somme des rangs en additionnant les rangs par groupe ;
l'ampleur de la somme de rangs vous indique à quel point les rangs sont rapprochés pour chaque groupe
Rang moyen
M / R est une statistique plus sophistiquée que R / S car elle compense les tailles inégales dans les groupes que vous comparez. Par conséquent, en plus des étapes ci-dessus, vous divisez chaque somme par le nombre de membres du groupe.
Une fois que vous avez ces deux statistiques, vous pouvez, par exemple, z-tester la somme de rang pour voir si la différence entre les deux groupes est statistiquement significative (je crois que cela s'appelle le test de Wilcoxon rank sum , qui est interchangeable, c'est-à-dire équivalent au test U de Mann-Whitney).
R Fonctions pour ces statistiques (celles que je connais, en tout cas):
wilcox.test dans l'installation standard de R
meanranks dans le pédaliers Package
la source
Basé sur le résumé Cet article peut être utile pour comparer plusieurs variables qui sont à l’échelle de Likert. Il compare deux types de tests de comparaison multiples non paramétriques: l'un basé sur les rangs et l'autre sur un test de Chacko. Il comprend des simulations.
la source
J'aime généralement utiliser l'intrigue en mosaïque. Vous pouvez les créer en incorporant d'autres covariables d'intérêt (telles que: sexe, facteurs stratifiés, etc.).
la source
Je suis d'accord avec l'évaluation de Jeromy Anglim. N'oubliez pas que les réponses de Likert sont des estimations: vous n'utilisez pas de règle parfaitement fiable pour mesurer un objet physique dont les dimensions sont stables. La moyenne est une mesure puissante lorsqu’on utilise des échantillons de taille raisonnable.
Dans la R & D des entreprises et des produits, la moyenne est de loin la statistique la plus utilisée avec les échelles de Likert. Lors de l'utilisation des échelles de Likert, j'ai généralement choisi une mesure qui correspond parfaitement à la question de recherche. Par exemple, si vous parlez de "préférence" ou d '"attitudes", vous pouvez utiliser plusieurs indicateurs basés sur Likert, chaque indicateur fournissant un aperçu légèrement différent.
la source
Les "scores en boîte" sont souvent utilisés pour résumer des données ordinales, en particulier lorsqu'il s'agit d'ancres verbaux significatifs. En d'autres termes, vous pouvez indiquer "2 cases supérieures", le pourcentage ayant choisi "d'accord" ou "tout à fait d'accord".
la source