0 est-il une valeur valide dans une échelle de Likert?

8

J'ai réalisé mon étude pilote sur la motivation à l'apprentissage des langues en utilisant une échelle de Likert à 6 points mais de 0 (fortement en désaccord) à 5 (tout à fait d'accord). J'ai remarqué qu'un collègue dans son enquête utilisait 1 à 6. Mes variables calculées (somme et moyenne) seront-elles les mêmes que si j'avais utilisé 1 à 6? Est-il normalement recommandé de ne pas utiliser de 0 pour une raison quelconque? Je suis nouveau sur SPSS mais j'ai réussi à faire la plupart de ce que je dois faire, mais je crains maintenant que mes valeurs soient «déformées». Je ne comprends pas comment SPSS ajoute un 0 dans une équation.

Imelda
la source
6
Je soupçonne - mais sans être en mesure de fournir des preuves - qu'il peut y avoir une différence psychologique entre les échelles 1..6 et 0..5, principalement en raison des différences dans la façon dont 0 est vécu et compris par les gens par rapport à leurs perceptions d'entiers positifs, et peut-être parce que les gens peuvent penser en termes relatifs au maximum, de sorte que dans un cas le changement de 5 à 6 est 1/6 du maximum alors que dans l'autre cas il serait (à tort) considéré comme égal à 1/5 du maximum. Peut-être que les psychologues de notre communauté pourraient donner leur avis à ce sujet?
whuber
2
@whuber En effet, il s'agit d'un sujet de longue date dans la conception des questionnaires - en particulier en ce qui concerne les échelles uni- vs bipolaires. Pour une vue d'ensemble, voir Schwarz. 1996. Cognition et communication: biais de jugement, méthodes de recherche et logique de la conversation. Mahwah, NJ: Lawrence Erlbaum. Quelques références supplémentaires .
caracal
7
Un élément de type Likert à 5 points est souvent utilisé, où les catégories de réponse sont "fortement en désaccord", "désagréable", "ni ag. Ni en désaccord", "ag." Et "fortement ag.", Sans chiffres explicites. But. Quelle est votre 6ème catégorie? Le codage des réponses est sans importance, pour la régression, la vérification des données ou les statistiques sommaires. Toute méthode de mise à l'échelle, de liaison ou d'égalisation peut en tenir compte. Ce qui compte vraiment, c'est le modèle de mesure sous-jacent que vous êtes prêt à assumer, car il déterminera si les scores doivent être traités comme des scores discrets dépendants de l'échantillon ou comme une «réflexion» d'un trait latent sur une échelle discrète.
chl
Je suis l'affiche de la question originale. L'ensemble du quesitonnaire sur la motivation était composé de 80 items regroupés en 16 sous-échelles avec un critère de mesure d'effort ininterrompu également noté sur l'échelle de likert. Toutes les réponses étaient comprises entre 0 (totalement en désaccord) et 5 (entièrement d'accord). merci à tous pour les réponses perspicaces, sur la base de celles-ci, j'ai maintenu la note d'origine.

Réponses:

8

Permettez-moi de faire quelques observations. Tout d' abord, si vous avez juste 1 question, vous n'avez pas techniquement une Likert échelle , mais juste une note ordinale. En tout cas, je ne vois pas comment il y aura une différence significative. Ce n'est qu'un décalage linéaire. Cela ne fera aucune différence si vous utilisez une analyse ordinale comme la régression logistique ordinale ou un test U de Mann-Whitney, ou une option plus standard comme la régression OLS ou un test t.

gung - Réintégrer Monica
la source
7

Je dois être en désaccord partiel avec @MichaelChernick. Alors que les réponses à une seule question Likert (de 0 à 5 ou de 1 à 6 ou autre) sont clairement ordinales, il y a généralement une somme de plusieurs éléments d'échelle de Likert. À un moment donné, le nombre de valeurs possibles devient si élevé qu'il est essentiellement continu.

Comme vous le savez (mais l'affiche de la question peut ne pas l'être), la régression OLS ne suppose pas que la variable dépendante est normalement distribuée, mais seulement que les erreurs (estimées par les résidus) le sont.

Si nous additionnons un tas d'éléments Likert, savons-nous que les intervalles sont vraiment égaux? Non, pas vraiment. Mais savons-nous cela pour, disons IQ? Ou même un revenu? La différence entre un QI de 130 et 140 est-elle la même que 100 et 110? Cette question a-t-elle même un sens? Qu'en est-il d'une augmentation de 10 000 $ pour quelqu'un qui gagne 10 000 $ contre 100 000 $ par an?

J'ai écrit un blog entier à ce sujet.

De plus, il n'est pas clair pour moi si cette échelle de Likert va être une variable dépendante ou indépendante.

Peter Flom
la source
Je suppose que cela dépend si le PO souhaite comparer des questions individuelles ou des groupes de questions (communément appelés domaines dans la littérature de l'enquête). Mais comment les sommes entières sont-elles continues? Ils sont plus grands mais ils sont toujours des nombres entiers et non continus. De plus, la somme ne change pas magiquement d'ordinaire à nominale, donc je ne comprends pas ce que vous essayez de dire. OLS suppose que les covariables sont fixes et que les résidus sont normaux. En effet, cela signifie que la variable dépendante conditionnée aux covariables est normale.
Michael R. Chernick
2
@Michael Vous voudrez peut-être consulter certaines discussions antérieures sur la question de savoir si les échelles de Likert doivent être considérées comme continues ou discrètes . La notation variable reflète parfois la façon dont nous envisageons les données. Je peux également recommander De Boeck, P., Wilson, M. et Acton, GS (2005). Un cadre conceptuel et psychométrique pour distinguer les catégories et les dimensions . Psychological Review , 112 (1): 129-158.
chl
5

En suivant les suggestions de référence de @ caracal, j'ai trouvé une réponse presque directe ( non, ces deux systèmes de notation ne sont pas équivalents s'ils sont présentés sous forme d'options numériques aux répondants ) de Schwarz, Knäuper, Hippler, Noelle-Neumann et Clark (1991) . Ils présentent des données sur les réponses à la question «Jusqu'à quel point avez-vous réussi dans la vie jusqu'à présent? Une version a donné des options de notation de 0 à 10 à 480 participants; l'autre version avait des options de (-5) à (+ 5) avec zéro comme point médian, et a été vue par 552 participants. Les points de terminaison ont été étiquetés «pas du tout réussi» et «extrêmement réussi» dans les deux versions. "Indécis" était également une option pour les deux. Voici comment les choses se sont déroulées:

0–10 Scale5 to +5 ScaleScale ValuePercentageCumulativeScale ValuePercentageCumulative0......5111......4...1222312357213471411452034091361448+192272068+2234582088+335809694+4149410397+5498Undecided3100Undecided2100

Assez différent, clairement! Ils rapportent également pour cette différence. Bien sûr, cette différence n'apparaîtra pas si la différence n'est que dans les coulisses en termes de la façon dont vous codez les réponses, non visible pour les participants comme un moyen pour eux de fournir des réponses.χ2(10)=105.1,p<.0001


Il existe des méthodes de conception d'enquête simples qui permettent d'éviter de se soucier des effets psychologiques de l'assimilation des ancres de notation aux nombres. Fondamentalement, vous pouvez simplement éviter d'utiliser des chiffres! Par exemple:

  1. Permettez aux répondants de vérifier les cellules dans un tableau correspondant à leur préférence de réponse: chaque ligne peut être un élément différent, et chaque colonne peut être étiquetée avec votre ancre de notation, ou vice versa - aucun nombre impliqué. Voici à quoi cela pourrait ressembler (si l'on devait répondre sagement):

    Strongly DisagreeDisagreeMildly DisagreeMildly AgreeAgreeStrongly AgreeTumblers: better than pumpers!I look fat in this dress. *

    Wikipedia donne un autre style en utilisant des options marquées (par Nicholas Smith ):

  2. Les codes de lettres peuvent également être remplacés par des options numériques si des blancs doivent être remplis pour une liste de très nombreux éléments; par exemple, { SD, D, MD, MA, A, SA}. N'oubliez pas d'inclure la légende!


Référence
Schwarz, N., Knäuper, B., Hippler, HJ, Noelle-Neumann, E., & Clark, L. (1991). Les valeurs numériques des échelles de notation peuvent changer la signification des étiquettes d'échelle. Public Opinion Quarterly, 55 (4), 570-582.

Nick Stauner
la source
Y a-t-il une raison de voir les échelles innombrables comme meilleures ?
Scortchi - Réintégrer Monica
1
@Scortchi: ils devraient au moins diminuer l'ambiguïté des réponses. Il me semble peu probable que les répondants et les chercheurs parviennent à une meilleure compréhension les uns des autres en mélangeant les langues des ancres verbales et numériques. Il semble plus probable que les chercheurs concevraient leurs indices de manière arbitraire et naïve, et les répondants décideraient de la manière de répondre de manière incohérente (dans le sens entre les sous- sujets et entre eux) en fonction de l'ensemble d'ancrages qui leur semble plus logique personnellement en général, ou pire, pour certains articles . Merci pour votre modification perspicace BTW. Oeil de lynx!
Nick Stauner
1
Ce n'est que mon intuition qui parle maintenant de BTW, mais par exemple, un élément comme "Ceci est une bonne réponse" pourrait plaire davantage à une échelle de 0 à 10 en association avec le système de notation académique typique qui va de 0 à 100% de crédit ... alors que "Obama est un bon président" pourrait faire davantage appel à un système (-5) - (+ 5) car cela donnerait aux conservateurs un moyen d'exprimer leur sentiment de blessure, pas seulement leur mécontentement. Je suppose que cette dernière question ne produirait aucune préférence entre les systèmes de notation verbale et numérique, alors que le système numérique pourrait être légèrement préféré pour la question précédente.
Nick Stauner
1
... juste en termes de la façon dont les gens penseraient à leurs choix de réponses, leurs choix entre les systèmes de notation verbale et numérique se faisant probablement à un niveau préconscient / automatique / moins que délibéré le plus souvent parmi les participants avec différents degrés de conscience de soi , souci du détail, ou " esprit psychologique ". Une certaine quantité d'apprentissage se produit au cours du remplissage d'un long questionnaire. IIRC, cela conduit à des réponses plus cohérentes (peut-être biaisées) à mesure que les éléments commencent à se brouiller. </ spéculation sauvage et conjecture>
Nick Stauner
1
Tout cela semble très plausible - j'admets que je cherchais une autre étude sur la question. (Je me souviens d'un qui prétendait montrer l'existence d'un effet de "clôture" dans lequel le niveau intermédiaire d'un élément avec un nombre impair de niveaux était surreprésenté par rapport aux deux niveaux intermédiaires d'un élément avec un nombre égal. . - Je
posterai
2

Pour effectuer une analyse avec des échelles ordinales comme le Likert, vous utiliseriez des méthodes non paramétriques basées sur les rangs. Ce qui importe avec les échelles ordinales, c'est l'ordre si 5 est le meilleur, 0 le pire, 1 est meilleur que 0, 2 est meilleur que 1 etc. Les rapports et les intervalles n'ont aucun sens pour les données ordinales. Donc, une échelle de 1-6 contre 0-5 n'a pas d'importance et n'affectera pas l'analyse. Commencer par 1 est dû à la tradition plutôt qu'à la nécessité.

Michael R. Chernick
la source
2
«Les ratios et les intervalles n'ont aucun sens pour les données ordinales» dépend du modèle de mesure sous-jacent que vous êtes prêt à supposer.
chl
@Chl Quel est votre point?
Michael R. Chernick
3
Mon point est que certains modèles psychométriques considèrent explicitement la réponse discrète comme un proxy reflétant sa position (ou sa responsabilité) sur un trait latent, comme détaillé dans une de mes réponses . Je suis d'accord avec le reste de votre réponse, qui est essentiellement fondée sur l'idée de traiter les scores de somme (pas dans ce cas, mais vous aurez l'idée) comme moyen de classer les individus sur une construction donnée (dans le cadre du CTT ).
chl
3
Mais les variables ne sont généralement pas strictement ordinales ou d'intervalle. L'application aveugle de la taxonomie de Stevens est tout aussi mauvaise que l'application aveugle de toute autre règle. Pour strictement ordinal, vous pouvez le recoder en 0, 2, 2.1, 2.2, 2.3, 19288191. Mais le feriez- vous? Et, autre que des mesures physiques, ce qui est vraiment intervalle?
Peter Flom
-1

Je pense que les points devraient être déterminés selon le cadrage des questions. Comme si, si les questions sont liées à l'attitude, alors les points doivent être donnés de 1 à 5, pas de 0 à 4 parce que nous essayons de connaître l'attitude. Et l'attitude ne peut pas se situer au niveau 0; même le répondant marque sur l'option Fortement en désaccord mais on ne peut pas mentionner 0 (zéro) sur cette réponse. Les variables peuvent être similaires. Donc, en tant que chercheur, nous devrions essayer de déterminer les points de 1 à 5; 1-7 etc.

Jiten
la source