Existe-t-il des mesures de similitude ou de distance entre deux matrices de covariance symétrique (toutes deux ayant les mêmes dimensions)?
Je pense ici aux analogues de la divergence KL de deux distributions de probabilités ou de la distance euclidienne entre vecteurs sauf appliquée aux matrices. J'imagine qu'il y aurait pas mal de mesures de similitude.
Idéalement, je voudrais également tester l'hypothèse nulle selon laquelle deux matrices de covariance sont identiques.
distributions
hypothesis-testing
covariance-matrix
kullback-leibler
information-theory
Ram Ahluwalia
la source
la source
Réponses:
Vous pouvez utiliser n'importe laquelle des normes (voir Wikipedia sur une variété de normes; notez que la racine carrée de la somme des distances au carré, \ sqrt {\ sum_ {i, j} (a_ {ij} -b_ {ij}) ^ 2} , est appelée norme de Frobenius, et diffère de la norme L_2 , qui est la racine carrée de la plus grande valeur propre de (AB) ^ 2 , bien que, bien sûr, elles généreraient la même topologie). La distance KL entre les deux distributions normales avec les mêmes moyennes (disons zéro) et les deux matrices de covariance spécifiques est également disponible dans Wikipedia sous la forme \ frac12 [\ mbox {tr} (A ^ {- 1} B) - \ mbox {ln } (| B | / | A |)] .∥A−B∥p ∑i,j(aij−bij)2−−−−−−−−−−−−√ L2 (A−B)2 12[tr(A−1B)−ln(|B|/|A|)]
Edit: si l'une des matrices est une matrice impliquée par le modèle et l'autre est la matrice de covariance échantillon, alors bien sûr, vous pouvez former un test de rapport de vraisemblance entre les deux. Ma collection préférée personnelle de tels tests pour des structures simples est donnée dans Rencher (2002) Methods of Multivariate Analysis . Les cas plus avancés sont couverts par la modélisation de la structure de covariance, sur laquelle un point de départ raisonnable est Bollen (1989) Structural Equations with Latent Variables .
la source
Désignons et vos matrices deux de dimension .Σ1 Σ2 p
Edit: J'ai édité la deuxième des deux propositions. Je pense que j'avais mal compris la question. La proposition basée sur les nombres de conditions est beaucoup utilisée dans les statistiques robustes pour évaluer la qualité de l'ajustement. Une ancienne source que j'ai pu trouver est:
J'avais initialement inclus la mesure du ratio Det:
qui serait la distance de Bhattacharyya entre deux distributions gaussiennes ayant le même vecteur de localisation. J'ai dû lire à l'origine la question comme se rapportant à un contexte où les deux covariances provenaient d'échantillons de populations supposées avoir des moyennes égales.
la source
Une mesure introduite par Herdin (2005) Correlation Matrix Distance, une mesure significative pour l'évaluation des canaux MIMO non stationnaires est où la norme est la norme Frobenius.d=1−tr(R1⋅R2)∥R1∥⋅∥R2∥,
la source
La distance de la matrice de covariance est utilisée pour suivre les objets en vision par ordinateur.
La métrique actuellement utilisée est décrite dans l'article: "Une métrique pour les matrices de covariance" , par Förstner et Moonen.
la source