J'utilise R pour l'analyse des données. R fournit une corr
fonction pour calculer la corrélation. Cette fonction fournit trois approches / algorithmes différents pour estimer les corr
Pearson, Spearman et Kendall. Quand dois-je utiliser chacune de ces méthodes? Quels facteurs déterminent la méthode à utiliser?
correlation
r
asheeshr
la source
la source
Réponses:
Le coefficient produit-moment de Pearson (paramètre Pearson) mesure la corrélation linéaire entre les variables. Par conséquent, il est approprié lorsque votre corrélation suspectée est linéaire, ce qui peut être inspecté visuellement avec un tracé.
Le coefficient de Kendall Tau (paramètre kendall) et le coefficient de corrélation de Spearman (paramètre spearman) sont des mesures de corrélations de rang. La corrélation entre les deux variables n'a donc pas besoin d'être linéaire. La méthode spearman est fondamentalement la méthode Pearson, mais appliquée sur les rangs des valeurs (le rang d'une valeur est donné par sa position après le tri des valeurs). La méthode kendal est construite essentiellement comme une statistique sous forme de ration entre le nombre supplémentaire de paires ordonnées et le nombre total de paires. Pour la méthode kendal, car elle est construite comme une statistique, on peut construire aussi l'utiliser dans le cadre du test d'hypothèse, avec tous les avantages (on l'appelle test tau).
Toutes ces méthodes sont des instruments utilisés pour déduire quelque chose sur les dépendances entre les variables aléatoires. En savoir plus sur la page dédiée de Wikipedia dédiée à la corrélation et la dépendance
la source