Existe-t-il une caractérisation intuitive de la corrélation de distance?

14

J'ai regardé la page wikipedia pour la corrélation de distance où elle semble être caractérisée par la façon dont elle peut être calculée. Bien que je puisse faire les calculs, j'ai du mal à obtenir quelles mesures de corrélation de distance et pourquoi les calculs se présentent comme ils le font.

Existe-t-il une (ou plusieurs) caractérisation plus intuitive de la corrélation de distance qui pourrait m'aider à comprendre ce qu'elle mesure?

Je me rends compte que demander l' intuition est un peu vague, mais si j'avais su quel genre d'intuition je demandais, je ne l'aurais probablement pas demandé en premier lieu. Je serais également heureux de l'intuition concernant le cas de la corrélation de distance entre deux variables aléatoires (même si la corrélation de distance est définie entre deux vecteurs aléatoires).

Rasmus Bååth
la source

Réponses:

8

Ce ma réponse ne correctement à la question. Veuillez lire les commentaires.

Σ(xiμx)(yiμy)μΣdiμxdiμydi

Σdijxdijyd

xy

Et en effet, la covariance habituelle est plus grande lorsque la relation est plus proche pour être parfaitement linéaire et que les variances sont plus grandes. Si vous standardisez les variances à une unité fixe, la covariance ne dépend que de la force de l'association linéaire, et elle est alors appelée corrélation de Pearson . Et, comme nous le savons - et nous venons de comprendre pourquoi - la covariance de distance est plus grande lorsque la relation est plus proche d'une courbe parfaite et que les écarts de données sont plus importants. Si vous standardisez les écarts à une unité fixe, la covariance dépend uniquement de la force d'une association curviligne, et elle est alors appelée corrélation brownienne (distance) .

ttnphns
la source
Le deuxième paragraphe l'a fait cliquer pour moi. Je ne sais pas pourquoi je n'ai pas vu ça sur la page wikipedia ... Merci!
Rasmus Bååth
Je me demande simplement où se trouve dans en.wikipedia.org/wiki/Brownian_covariance#Distance_covariance le numérateur de votre exemple (ou comment passer de votre numérateur à la version wikipedia)? Wikipedia vient de décrire comment calculer le carré de la covariance de distance et j'ai un peu de mal à faire correspondre votre description avec la description là-bas ...
Rasmus Bååth
@Rasmus, ma "formule de numérateur" est d'accord avec la formule wikipedia de la covariance de la distance de l'échantillon au carré. Mais j'ai raté une nuance (importante) que les distancessont transformés par double centrage. Je devrai donc peut-être modifier ma réponse. J'espère trouver le temps de revenir dans quelques jours, sinon demain.
ttnphns
Oui, le double centrage me laisse perplexe. Serait grandement apprécié si vous aviez le temps de clarifier cela! :)
Rasmus Bååth
1
Ce qui m'échappe encore, c'est pourquoi une puissance inférieure, par exemple par défautα=1, qui rétrécit et décentre les écarts obtenus au double centrage, fait de dCOV la statistique qui a sa propriété unique: c'est 0 ssi X et Y sont statistiquement indépendants. Parce que je n'en ai pas l'intuition ou la connaissance, j'ai peur que le deuxième paragraphe de ma réponse soit une mauvaise interprétation ou une simplification. J'ai donc tendance à supprimer ma réponse. Pouvez-vous dire quelque chose?
ttnphns