Quelles sont les «meilleures» mesures pour les matrices de covariance, et pourquoi? Il est clair pour moi que Frobenius & c n'est pas approprié, et les paramétrisations d'angle ont aussi leurs problèmes. Intuitivement, on pourrait vouloir un compromis entre ces deux, mais j'aimerais aussi savoir s'il y a d'autres aspects à garder à l'esprit et peut-être des normes bien établies.
Les métriques communes ont divers inconvénients car elles ne sont pas naturelles pour les matrices de covariance, par exemple, elles ne pénalisent pas spécialement les matrices non PSD ou ne se comportent pas bien par rapport au rang (considérons deux ellipsoïdes de covariance de bas rang tournés: j'aimerais la même chose - rotation intermédiaire du classement pour avoir des distances inférieures à la moyenne des composants, ce qui n'est pas le cas avec et peut-être Frobenius, veuillez me corriger ici). De plus, la convexité n'est pas toujours garantie. Ce serait bien de voir ces problèmes et d'autres traités par une "bonne" mesure.
Voici une bonne discussion de certains problèmes, un exemple d'optimisation de réseau et un de vision par ordinateur . Et voici une question similaire, obtenant d'autres mesures, mais sans discussion.
la source
Réponses:
Eh bien, je ne pense pas qu'il existe une bonne métrique ou «la meilleure façon» d'analyser les matrices de covariance. L'analyse doit toujours être alignée sur votre objectif. Disons que C est ma matrice de covariance. La diagonale contient la variance pour chaque paramètre calculé. Donc, si vous êtes intéressé par la signification des paramètres, la trace (C) est un bon début car c'est votre performance globale.
Si vous tracez votre paramètre et sa signification, vous pouvez voir quelque chose comme ceci:
Si vous êtes intéressé par leur corrélation mutuelle, un tel tableau pourrait produire quelque chose d'intéressant:
Chaque élément est le coefficient de corrélation entre les paramètres xi et xj. D'après l'exemple, il est visible que les paramètres x1 et x2 sont fortement corrélés.
la source
Question intéressante, je suis aux prises avec le même problème en ce moment! Cela dépend de la façon dont vous définissez le «meilleur», c'est-à-dire que vous recherchez une valeur unique moyenne pour l'écart ou la corrélation entre les données, etc. J'ai trouvé dans Press, SJ (1972): Applied Multivariate Analysis, p. 108 que la variance généralisée, définie comme le déterminant de la matrice de covariance, est utile comme mesure unique de l'écart. Mais si c'est la corrélation que vous recherchez, je devrai réfléchir plus loin. Faites le moi savoir.
la source