J'ai un ensemble de données composé de 10 variables. J'ai exécuté des moindres carrés partiels (PLS) pour prédire une seule variable de réponse par ces 10 variables, extrait 10 composantes PLS, puis calculé la variance de chaque composante. Sur les données originales, j'ai pris la somme des variances de toutes les variables qui est 702.
Ensuite, j'ai divisé la variance de chacun des composants PLS par cette somme pour obtenir le pourcentage de la variance expliquée par le PLS, et étonnamment tous les composants ensemble expliquent simplement 44% de la variance d'origine.
Quelle est l'explication de cela? Cela ne devrait-il pas être à 100%?
Réponses:
La somme des variances de tous les composants PLS est normalement inférieure à 100%.
Il existe de nombreuses variantes des moindres carrés partiels (PLS). Ce que vous avez utilisé ici, c'est la régression PLS d'une variable de réponse univariée sur plusieurs variables ; cet algorithme est traditionnellement appelé PLS1 (contrairement à d'autres variantes, voir Rosipal & Kramer, 2006, Overview and Recent Advances in Partial Least Squares pour un aperçu concis). PLS1 s'est avéré plus tard équivalent à une formulation plus élégante appelée SIMPLS (voir la référence au Jwall 1988 paywalled dans Rosipal & Kramer). La vue fournie par SIMPLS permet de comprendre ce qui se passe dans PLS1.y X
Il s'avère que ce que fait PLS1, c'est de trouver une séquence de projections linéaires , telle que:ti=Xwi
Notez que les vecteurs de poids ne doivent pas être (et ne sont pas) orthogonaux.
Cela signifie que si est composé de variables et que vous avez trouvé composants PLS, vous avez trouvé une base non orthogonale avec des projections non corrélées sur les vecteurs de base. On peut mathématiquement prouver que , dans une telle situation , la somme des écarts de toutes ces projections sera inférieure à la variance totale de . Ils seraient égaux si les vecteurs poids étaient orthogonaux (comme par exemple en PCA), mais en PLS ce n'est pas le cas.X k=10 10 X
Je ne connais aucun manuel ou article qui traite explicitement de cette question, mais je l'ai expliqué plus tôt dans le contexte de l'analyse discriminante linéaire (LDA) qui produit également un certain nombre de projections non corrélées sur des vecteurs de poids unitaire non orthogonaux, voir ici : Proportion de la variance expliquée dans le PCA et le LDA .
la source
PCTVAR
(pourcentage de variance expliqué en X) ne correspond-elle pas à vos calculs? Ou posez-vous des questions sur la deuxième colonne (pourcentage de variance expliqué en y)? En général, si vous voulez entrer dans les mathématiques PLS, je vous suggère de commencer à lire l'article de Rosipal & Kramer et de suivre les liens.