Je veux transformer mes données telle sorte que les variances soient égales à un et que les covariances soient nulles (c'est-à-dire que je veux blanchir les données). De plus, les moyennes doivent être nulles.
Je sais que j'y arriverai en faisant la standardisation Z et la transformation PCA, mais dans quel ordre dois-je les faire?
Je dois ajouter que la transformation de blanchiment composée devrait avoir la forme .
Existe-t-il une méthode similaire à l'ACP qui effectue exactement ces deux transformations et me donne une formule de la forme ci-dessus?
pca
linear-algebra
Angelorf
la source
la source
Réponses:
Tout d'abord, vous obtenez le zéro moyen en soustrayant la moyenne .μ = 1N∑ x
Deuxièmement, vous obtenez les covariances nulles en faisant PCA. Si est la matrice de covariance de vos données, alors PCA revient à effectuer une composition par eigendecomposition , où est une matrice de rotation orthogonale composée de vecteurs propres de et est une matrice diagonale avec des valeurs propres sur la diagonale. La matrice donne une rotation nécessaire pour décorréler les données (c'est-à-dire mapper les caractéristiques originales aux composants principaux).Σ = U Λ U ⊤ U Σ Λ U ⊤Σ Σ = U Λ U⊤ U Σ Λ U⊤
Troisièmement, après la rotation, chaque composante aura une variance donnée par une valeur propre correspondante. Donc, pour faire des variances égales à , vous devez diviser par la racine carrée de .Λ1 Λ
Dans l'ensemble, la transformation de blanchiment est . Vous pouvez ouvrir les crochets pour obtenir le formulaire que vous recherchez.x ↦ Λ- 1 / deuxU⊤( x - μ )
Mise à jour. Voir aussi ce fil ultérieur pour plus de détails: Quelle est la différence entre le blanchiment ZCA et le blanchiment PCA?
la source