Je viens d'être initié (vaguement) à la covariance / corrélation brownienne / distance . Il semble particulièrement utile dans de nombreuses situations non linéaires, lors du test de dépendance. Mais il ne semble pas être utilisé très souvent, même si la covariance / corrélation est souvent utilisée pour les données non linéaires / chaotiques.
Cela me fait penser qu'il pourrait y avoir des inconvénients à la covariance de distance. Alors, quels sont-ils et pourquoi tout le monde n'utilise-t-il pas toujours la covariance de distance?
Réponses:
J'ai essayé de recueillir quelques remarques sur la covariance de distance en fonction de mes impressions en lisant les références répertoriées ci-dessous. Cependant, je ne me considère pas comme un expert sur ce sujet. Les commentaires, corrections, suggestions, etc. sont les bienvenus.
Les remarques sont (fortement) biaisées vers des inconvénients potentiels, comme demandé dans la question initiale .
Selon moi, les inconvénients potentiels sont les suivants:
Je le répète, cette réponse est probablement assez négative. Mais ce n'est pas l'intention. Il existe quelques idées très belles et intéressantes liées à la covariance à distance et la relative nouveauté de celle-ci ouvre également des voies de recherche pour mieux la comprendre.
Références :
la source
Je pourrais bien manquer quelque chose, mais le simple fait d'avoir une quantification de la dépendance non linéaire entre deux variables ne semble pas avoir beaucoup d'intérêt. Cela ne vous dira pas la forme de la relation. Cela ne vous donnera aucun moyen de prédire une variable de l'autre. Par analogie, lors de l'analyse exploratoire des données, on utilise parfois une courbe de loess (nuage de points localement pondéré plus lisse) comme première étape pour voir si les données sont mieux modélisées avec une ligne droite, un quadratique, un cube, etc. Mais le loess dans et en soi n'est pas un outil prédictif très utile. Ce n'est qu'une première approximation sur la façon de trouver une équation réalisable pour décrire une forme bivariée. Contrairement au lœss (ou au résultat de la covariance de distance), cette équation peut constituer la base d'un modèle de confirmation.
la source