Limite la différence entre la corrélation de Spearman et la corrélation de Kendall

9

J'essaie de prouver ou de réfuter que la différence entre la corrélation de Spearman et la corrélation de Kendall n'est pas supérieure à 1 (ou moins, plus serré est le joyeux).

Je suppose qu'il n'y a aucun lien.

Dans une tentative de réfuter le résultat en utilisant un exemple de compteur, j'ai vérifié toutes les possibilités pour les vecteurs de longueur 8. J'ai obtenu de jolies images mais pas d'exemple de compteur:

différence:

La différence n'est jamais supérieure à 0,4 dans ce cas, donc je pense que c'est vrai, mais je n'ai pas pu le prouver.

Pqqwetiqe
la source
1
Il y a un article très intéressant qui pourrait être un double partiel de votre question. C'est "Kendall Tau ou le rho de Spearman? Stats.stackexchange.com/questions/3943/kendall-tau-or-spearmans-rho.
Michael R. Chernick
1
Pour ceux qui voudraient aborder une approche algébrique directe, je pense que le résultat peut être obtenu en deux étapes. Tout d'abord (l'étape clé), montrer que la valeur absolue absolue de la différence est atteinte pour les données pour points et pour points. Ensuite, calculez simplement les différences pour ces ensembles de données. (Dans le premier cas, il y a un autre maximum et dans le second, il y a trois autres maxima impliqués par des symétries évidentes.)
(1,n),(2,n1),,(n,1),(n+1,2n),(n+2,2n1),,(2n,n+1)
2n
(1,n+1),(2,n),,(n+1,1),(n+2,2n+1),(n+3,2n),,(2n+1,n+2)
2n+1
whuber
2
@Glen_b Si j'ai raison, alors la différence absolue maximale pour les données de longueur est qui a une valeur limite de (par le bas) commen
2(n2)n2n2n(n21),
1/2n.Cela confirme ce que vous avez écrit. Cette formule est liée à A111384 , dont les valeurs sont divisées parn(n21)/4.
whuber
1
Cette limite semble correspondre à votre formule pour même n (et vos cas limites dans le commentaire précédent semblent certainement correspondre à ceux obtenus par calcul exhaustif pour tous les petits nvaleurs que je pourrais facilement vérifier - mais je suppose que vous l'avez déjà fait). Il est intéressant de noter que la limite est de 1/2. Ai-je fait une erreur dans le cas impair n? (modifier: Non, je vois maintenant, j'étais juste en dehors de manipuler votre formule)
Glen_b -Reinstate Monica
2
@Glen_b Une limite de1/2 est intuitif: pour les motifs que j'ai décrits, Spearman est proche de 1/2 tandis que Kendall est O(1/n). L'algèbre est simplifiée en généralisant mon approche "crayon" de la covariance. Voici le Rcode implémentant les formules pertinentes. Les arguments consistent en deux permutations de 1:n. Spearman : function(x, y) mean(outer(x, x, '-') * outer(y, y, '-')) * 6 / (length(x)^2 - 1) Kendall :function(x,y) mean(sign(outer(x, x, '-')) * sign(outer(y, y, '-'))) * (1 + 1/(length(x)-1))
whuber

Réponses:

0

Vous voudrez peut-être consulter ce document ! Et d'autres œuvres de ces auteurs. Je ne me souviens pas exactement où, mais j'ai vu votre premier graphique dans leurs papiers, et quelques preuves avec. Je pense que cela peut être fait en tirant parti des copules (comme Kendall tau et Spearman rho peuvent être écrits en fonction de la copule sous-jacente entre les deux variables). J'espère que cela aide.

C est la copule de (X,Oui).

τ(X,Oui)=40101C(u,v)c(u,v)uv-1

(La corrélation de Kendall est l'espérance de la copule redimensionnée en [0,1])

ρ(X,Oui)=120101C(u,v)uv-3

Alors, |τ-ρ|

micro
la source
2
Le papier est une belle référence pour les techniques qu'il expose. Il ne semble cependant pas contenir un résultat qui impliquerait facilement celui conjecturé dans cette question. C'est principalement parce que ses résultats ne sont pas universels: ils s'appliquent dans diverses conditions restrictives et même alors seulement dans la limite à mesure que la distribution conjointe approche de l'indépendance.
whuber