Réponses précédentes sur ce site:
Des questions connexes ont été posées plusieurs fois sur ce site. Check-out
Échelles par rapport aux articles:
D'après mon expérience, il existe une différence entre l'exécution d'analyses sur un élément likert par opposition à une échelle likert. Une échelle de likert est la somme de plusieurs éléments. Après avoir additionné plusieurs éléments, les échelles de likert obtiennent plus de valeurs possibles, l'échelle résultante est moins grumeleuse. De telles échelles ont souvent un nombre suffisant de points que de nombreux chercheurs sont prêts à les traiter comme continus. Bien sûr, certains diront que c'est un peu cavalier, et beaucoup a été écrit en psychométrie sur la meilleure façon de mesurer les constructions psychologiques et connexes.
Pratique standard en sciences sociales:
D'après mes observations occasionnelles de la lecture d'articles de revue en psychologie, la majorité des relations bivariées entre les échelles de Likert à plusieurs éléments sont analysées à l'aide du coefficient de corrélation de Pearson. Ici, je pense à des échelles comme la personnalité, l'intelligence, les attitudes, le bien-être, etc. Si vous avez des échelles comme celle-ci, il convient de considérer que vos résultats seront comparés aux résultats précédents où Pearson était peut-être le choix dominant.
Comparez les méthodes:
C'est un exercice intéressant de comparer celui de Pearson avec celui de Spearman (et peut-être même celui de Kendall). Cependant, il vous reste à décider quelle statistique utiliser, et cela dépend finalement de la définition que vous avez de l'association bivariée.
Hétéroscédasticité
Un coefficient de corrélation est un résumé précis de la relation linéaire entre deux variables même en l'absence d'homoscédasticité (ou peut-être devrions-nous dire une normalité bivariée étant donné qu'aucune variable n'est une variable dépendante).
Non linéarité
S'il existe une relation non linéaire entre vos deux variables, c'est intéressant. Cependant, les deux variables peuvent toujours être traitées comme des variables continues et, par conséquent, vous pouvez toujours utiliser celle de Pearson. Par exemple, l'âge a souvent une relation en U inversé avec d'autres variables telles que le revenu, mais l'âge est toujours une variable continue.
Je vous suggère de produire un nuage de points et d'ajuster des ajustements lissés (tels qu'une spline ou LOESS) pour explorer toutes les relations non linéaires. Si la relation est vraiment non linéaire, la corrélation linéaire n'est pas le meilleur choix pour décrire une telle relation. Vous pourriez alors vouloir explorer la régression polynomiale ou non linéaire.
Vous devriez presque certainement opter pour le rho de Spearman ou le tau de Kendall. Souvent, si les données ne sont pas normales mais que les variances sont égales, vous pouvez opter pour le r de Pearson car cela ne fait pas une énorme différence. Si les variances sont significativement différentes, alors vous avez besoin d'une méthode non paramétrique.
Vous pourriez probablement citer presque n'importe quel manuel de statistiques d'introduction pour soutenir votre utilisation de Spearman's Rho.
Mise à jour: si l'hypothèse de linéarité est violée, vous ne devez pas utiliser le coefficient de corrélation de Pearson sur vos données, car il suppose une relation linéaire. Le Rho de Spearman est acceptable sans linéarité et est destiné à des relations monotones plus générales entre les variables. Si vous souhaitez utiliser le coefficient de corrélation de Pearson, vous pouvez consulter le journal transformant vos données car cela pourrait traiter de la non-linéarité.
la source
une chose est à peu près sûre que la corrélation nécessite une linéarité dans les relations en général. maintenant vous dites que vos données ont une forme de courbe, donc la régression non linéaire semble être le choix de gauche
la source