Corrélation de Spearman ou Pearson avec les échelles de Likert où la linéarité et l'homoscédasticité peuvent être violées

9

Je veux exécuter des corrélations sur un certain nombre de mesures où des échelles de Likert ont été utilisées. En regardant les diagrammes de dispersion, il apparaît que les hypothèses de linéarité et d'homoscédasticité peuvent avoir été violées.

  • Étant donné qu'il semble y avoir un débat autour de la notation du niveau ordinale approximant la mise à l'échelle du niveau d'intervalle, devrais-je jouer prudemment et utiliser Rho de Spearman plutôt que le r de Pearson?
  • Y a-t-il une référence que je peux citer si je choisis Rho de Spearman?
whuber
la source

Réponses:

13

Réponses précédentes sur ce site:

Des questions connexes ont été posées plusieurs fois sur ce site. Check-out

Échelles par rapport aux articles:

D'après mon expérience, il existe une différence entre l'exécution d'analyses sur un élément likert par opposition à une échelle likert. Une échelle de likert est la somme de plusieurs éléments. Après avoir additionné plusieurs éléments, les échelles de likert obtiennent plus de valeurs possibles, l'échelle résultante est moins grumeleuse. De telles échelles ont souvent un nombre suffisant de points que de nombreux chercheurs sont prêts à les traiter comme continus. Bien sûr, certains diront que c'est un peu cavalier, et beaucoup a été écrit en psychométrie sur la meilleure façon de mesurer les constructions psychologiques et connexes.

Pratique standard en sciences sociales:

D'après mes observations occasionnelles de la lecture d'articles de revue en psychologie, la majorité des relations bivariées entre les échelles de Likert à plusieurs éléments sont analysées à l'aide du coefficient de corrélation de Pearson. Ici, je pense à des échelles comme la personnalité, l'intelligence, les attitudes, le bien-être, etc. Si vous avez des échelles comme celle-ci, il convient de considérer que vos résultats seront comparés aux résultats précédents où Pearson était peut-être le choix dominant.

Comparez les méthodes:

C'est un exercice intéressant de comparer celui de Pearson avec celui de Spearman (et peut-être même celui de Kendall). Cependant, il vous reste à décider quelle statistique utiliser, et cela dépend finalement de la définition que vous avez de l'association bivariée.

Hétéroscédasticité

Un coefficient de corrélation est un résumé précis de la relation linéaire entre deux variables même en l'absence d'homoscédasticité (ou peut-être devrions-nous dire une normalité bivariée étant donné qu'aucune variable n'est une variable dépendante).

Non linéarité

S'il existe une relation non linéaire entre vos deux variables, c'est intéressant. Cependant, les deux variables peuvent toujours être traitées comme des variables continues et, par conséquent, vous pouvez toujours utiliser celle de Pearson. Par exemple, l'âge a souvent une relation en U inversé avec d'autres variables telles que le revenu, mais l'âge est toujours une variable continue.

Je vous suggère de produire un nuage de points et d'ajuster des ajustements lissés (tels qu'une spline ou LOESS) pour explorer toutes les relations non linéaires. Si la relation est vraiment non linéaire, la corrélation linéaire n'est pas le meilleur choix pour décrire une telle relation. Vous pourriez alors vouloir explorer la régression polynomiale ou non linéaire.

Jeromy Anglim
la source
1
+1 pour souligner la distinction entre les éléments Likert et les échelles Likert.
ThomasH
2

Vous devriez presque certainement opter pour le rho de Spearman ou le tau de Kendall. Souvent, si les données ne sont pas normales mais que les variances sont égales, vous pouvez opter pour le r de Pearson car cela ne fait pas une énorme différence. Si les variances sont significativement différentes, alors vous avez besoin d'une méthode non paramétrique.

Vous pourriez probablement citer presque n'importe quel manuel de statistiques d'introduction pour soutenir votre utilisation de Spearman's Rho.

Mise à jour: si l'hypothèse de linéarité est violée, vous ne devez pas utiliser le coefficient de corrélation de Pearson sur vos données, car il suppose une relation linéaire. Le Rho de Spearman est acceptable sans linéarité et est destiné à des relations monotones plus générales entre les variables. Si vous souhaitez utiliser le coefficient de corrélation de Pearson, vous pouvez consulter le journal transformant vos données car cela pourrait traiter de la non-linéarité.

richiemorrisroe
la source
-1

une chose est à peu près sûre que la corrélation nécessite une linéarité dans les relations en général. maintenant vous dites que vos données ont une forme de courbe, donc la régression non linéaire semble être le choix de gauche

THIRTHAALA NAAGA SAAYI KUMAAR
la source
6
Je ne pense pas que ce soit "assez sûr" du tout. Seule la corrélation de Pearson est une mesure de linéarité; sans doute le point principal sur les autres types de corrélation est qu'ils ont des idées plus détendues sur ce qui compte comme perfection dans les relations.
Nick Cox