Comment blanchir les données en utilisant l'analyse en composantes principales?

18

Je veux transformer mes données X telle sorte que les variances soient égales à un et que les covariances soient nulles (c'est-à-dire que je veux blanchir les données). De plus, les moyennes doivent être nulles.

Je sais que j'y arriverai en faisant la standardisation Z et la transformation PCA, mais dans quel ordre dois-je les faire?

Je dois ajouter que la transformation de blanchiment composée devrait avoir la forme xWx+b .

Existe-t-il une méthode similaire à l'ACP qui effectue exactement ces deux transformations et me donne une formule de la forme ci-dessus?

Angelorf
la source
(Mon premier commentaire était basé sur une mauvaise lecture de votre question.) L'ACP ne vous donne aucune covariance; vous pouvez ensuite standardiser les PC si vous le souhaitez. Cela semble étrange à faire, mais vous pouvez le faire.
Nick Cox
@NickCox Cela peut sembler étrange car les données transformées sont alors sphériques, ce qui semble peu informatif. Cependant, c'est la transformation que j'ai besoin de connaître, et non le résultat final. Je ne sais toujours pas à quoi ressemblerait la transformation. Je lis toujours sur PCA, cependant.
Angelorf

Réponses:

31

Tout d'abord, vous obtenez le zéro moyen en soustrayant la moyenne .μ=1Nx

Deuxièmement, vous obtenez les covariances nulles en faisant PCA. Si est la matrice de covariance de vos données, alors PCA revient à effectuer une composition par eigendecomposition , où est une matrice de rotation orthogonale composée de vecteurs propres de et est une matrice diagonale avec des valeurs propres sur la diagonale. La matrice donne une rotation nécessaire pour décorréler les données (c'est-à-dire mapper les caractéristiques originales aux composants principaux).Σ = U Λ UU Σ Λ UΣΣ=UΛUUΣΛU

Troisièmement, après la rotation, chaque composante aura une variance donnée par une valeur propre correspondante. Donc, pour faire des variances égales à , vous devez diviser par la racine carrée de .Λ1Λ

Dans l'ensemble, la transformation de blanchiment est . Vous pouvez ouvrir les crochets pour obtenir le formulaire que vous recherchez.xΛ1/2U(xμ)


Mise à jour. Voir aussi ce fil ultérieur pour plus de détails: Quelle est la différence entre le blanchiment ZCA et le blanchiment PCA?

amibe dit réintégrer Monica
la source
2
Je pense que vous devez diviser par les racines carrées des valeurs propres, car il s'agit d'une mise à l'échelle par SD, pas de variance.
Nick Cox
@NickCox: oui, bien sûr, vous avez raison. J'ai corrigé ma réponse. Je vous remercie!
Amoeba dit Reinstate Monica
1
J'ai vérifié empiriquement la formule. Merci de m'avoir aidé!
Angelorf