Dérivation de la matrice de diffusion totale (dans la classe + entre les classes)

14

Je jouais avec les méthodes PCA et LDA et je suis coincé à un moment donné, j'ai le sentiment que c'est si simple que je ne peux pas le voir.

Les matrices de dispersion -classe ( ) et -classe ( ) sont définies comme suit:S BSWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

La matrice de diffusion totale est donnée par:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

où C est le nombre de classes et N le nombre d'échantillons sont des échantillons, est la moyenne de la ième classe, est la moyenne globale.μ i μxμiμ

En essayant de dériver ST je suis arrivé à un point où j'avais:

(xμi)(μiμ)T+(μiμ)(xμi)T

comme terme. Cela doit être nul, mais pourquoi?


En effet:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]
nimcap
la source
2
La réponse est que vous additionnez les écarts de valeurs autour de leur moyenne et que cette somme est nulle. Mais que sont précisément , et ? Comment et liés à et ? La qualité des réponses dépendra de la précision avec laquelle nous devinons, mais vous nous forcez à faire beaucoup de devinettes! xmmimmiμμi
whuber
@whuber: Vous avez tout à fait raison, j'ai révisé ma question.
nimcap

Réponses:

8

Si vous supposez

1Nt=1Nxti=μi

alors

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

et la formule est valable. Vous traitez le deuxième terme de la même manière.

mpiktas
la source
2
(+1) Le second terme, étant la transposition du premier, doit également être nul :-).
whuber
@whuber, oui, ça aussi :)
mpiktas
Salut, je ne comprends pas pourquoi l'hypothèse tient? Quelqu'un peut-il expliquer cela?
Mvkt
1
@Mvkt Ce n'est pas tant une hypothèse que la définition de je suppose. Soit: est la moyenne des observations du groupe . Je m'attends à ce que la réponse utilise «assumer» parce que l'OP n'explique pas la notation, nous devons donc deviner que la moyenne du groupe est signifiée par . μiμiiμi
Vincent