J'ai rencontré la technique de traçage aléatoire suivante dans M. Seeger, «Mises à jour de bas rang pour la décomposition Cholesky», Université de Californie à Berkeley, Tech. Rep, 2007.
où .
En tant que personne sans formation approfondie en mathématiques, je me demande comment cette égalité peut être atteinte. De plus, comment interpréter , par exemple géométriquement? Où dois-je chercher pour comprendre le sens de prendre le produit intérieur d'un vecteur et sa valeur de plage? Pourquoi la moyenne est-elle égale à la somme des valeurs propres? Outre la propriété théorique, quelle est son importance pratique?
J'ai écrit un extrait de code MATLAB pour voir si cela fonctionne
#% tr(A) == E[x'Ax], x ~ N(0,I)
N = 100000;
n = 3;
x = randn([n N]); % samples
A = magic(n); % any n by n matrix A
y = zeros(1, N);
for i = 1:N
y(i) = x(:,i)' * A * x(:,i);
end
mean(y)
trace(A)
La trace est 15 où l'approximation est 14,9696.
la source
Si est défini positif symétrique, alors avec orthonormé, et diagonal avec des valeurs propres sur la diagonale. Puisque a une matrice de covariance d'identité et est orthonormé, a également une matrice de covariance d'identité. Donc en écrivant , on a . Puisque l'opérateur d'attente est linéaire, il s'agit simplement de . Chaque est un khi carré avec 1 degré de liberté, donc a la valeur attendue 1. Par conséquent, l'attente est la somme des valeurs propres.A A=UtDU U D x U Ux y=Ux E[xTAx]=E[ytDy] ∑ni=0λiE[y2i] yi
Géométriquement, les matrices définies positives symétriques sont en correspondance 1-1 avec les ellipsoïdes - données par l'équation . Les longueurs des axes de l'ellipsoïde sont données par où sont les valeurs propres.A xTAx=1 1/λ−−√i λi
Lorsque où est la matrice de covariance, c'est le carré de la distance de Mahalanobis .A=C−1 C
la source
Permettez-moi d'aborder la partie "quelle est son importance pratique" dans la question. Il y a beaucoup de situations dans lesquelles nous avons la possibilité de produits Compute vecteur de matrice efficace même si nous ne disposons pas d' une copie stockée de la matrice ou ne pas avoir assez de stockage pour enregistrer une copie de . Par exemple, peut être de taille 100 000 par 100 000 et entièrement dense - il faudrait 80 gigaoctets de RAM pour stocker une telle matrice au format à virgule flottante à double précision.Ax A A A
Algorithmes probabilistes comme celui - ci peuvent être utilisées pour estimer la trace d' ou ( en utilisant un algorithme connexe) entrées diagonales individuelles .A A
Certaines applications de cette technique à des problèmes d'inversion géophysique à grande échelle sont discutées dans
JK MacCarthy, B. Borchers et RC Aster. Estimation stochastique efficace de la matrice de résolution du modèle en diagonale et validation croisée généralisée pour les grands problèmes inverses géophysiques. Journal of Geophysical Research, 116, B10304, 2011. Lien vers l'article
la source