Le contexte:
J'ai deux ensembles de données provenant du même questionnaire sur deux ans. Chaque question est mesurée à l'aide d'une échelle de 5 Likert.
Q1: Schéma de codage
Pour le moment, j'ai codé mes réponses sur un intervalle [0, 1], 0 signifiant "la réponse la plus négative", 1 signifiant "la réponse la plus positive", et les autres réponses espacées également.
- Quel est le "meilleur" schéma de codage à utiliser pour l'échelle de Likert?
Je me rends compte que cela pourrait être un peu subjectif.
Q2: Importance sur plusieurs années
- Quelle est la meilleure façon de déterminer s'il y a un changement statistiquement significatif au cours des deux années?
Autrement dit, en regardant les résultats de la question 1 pour chaque année, comment puis-je savoir si la différence entre le résultat de 2011 et le résultat de 2010 est statistiquement significative? J'ai un vague souvenir du test t de Student utilisé ici, mais je ne suis pas sûr.
Le test de Wilcoxon Ranksum alias Mann-Whitney est la voie à suivre dans le cas de données ordinales. La solution d'amorçage est également élégante bien que ce ne soit pas la voie «classique». La méthode Bootstrapping peut également être utile si vous visez d'autres choses comme l'analyse factorielle. En cas d'analyse de régression, vous pouvez choisir un probit ordonné ou un logit ordonné comme spécification de modèle.
BTW: Si votre échelle a une plage plus large (> 10 valeurs par variable), vous pouvez utiliser les résultats comme une variable métrique, ce qui fait d'un test t un choix sûr. Soyez avisé que c'est un peu sale et peut être considéré comme le travail du diable par certains.
stephan
la source