La régression à rang réduit et la régression à composantes principales ne sont-elles que des cas particuliers de moindres carrés partiels?
Ce tutoriel (Page 6, "Comparaison des objectifs") indique que lorsque nous faisons des moindres carrés partiels sans projeter X ou Y (c'est-à-dire "non partiel"), cela devient une régression de rang réduit ou une régression de composante principale, en conséquence.
Une déclaration similaire est faite sur cette page de documentation SAS , sections "Régression de rang réduit" et "Relations entre méthodes".
Une question de suivi plus fondamentale est de savoir s'ils ont des modèles probabilistes sous-jacents similaires.
regression
pca
dimensionality-reduction
partial-least-squares
reduced-rank-regression
Minkov
la source
la source
Réponses:
Ce sont trois méthodes différentes, et aucune d'entre elles ne peut être considérée comme un cas particulier d'une autre.
Formellement, si et Y sont des ensembles de données de prédicteur centré ( n × p ) et de réponse ( n × q ) et si nous recherchons la première paire d'axes, w ∈ R p pour XX Y n×p n×q w∈Rp X et pour Y , alors ces méthodes maximiser les quantités suivantes:v∈Rq Y
(J'ai ajouté l'analyse de corrélation canonique (CCA) à cette liste.)
Je soupçonne que la confusion pourrait être due au fait qu'en SAS, les trois méthodes semblent être mises en œuvre via la même fonction
PROC PLS
avec des paramètres différents. Il peut donc sembler que les trois méthodes sont des cas particuliers de PLS car c'est ainsi que la fonction SAS est nommée. Ce n'est cependant qu'une dénomination malheureuse. En réalité, PLS, RRR et PCR sont trois méthodes différentes qui se trouvent être implémentées dans SAS dans une fonction qui, pour une raison quelconque, est appeléePLS
.Les deux didacticiels auxquels vous avez lié sont en fait très clairs à ce sujet. La page 6 du didacticiel de présentation énonce les objectifs des trois méthodes et ne dit pas que le PLS "devient" RRR ou PCR, contrairement à ce que vous avez affirmé dans votre question. De même, la documentation SAS explique que trois méthodes sont différentes, donnant des formules et de l'intuition:
Il y a même une figure dans la documentation SAS montrant un bel exemple de jouet où trois méthodes donnent des solutions différentes. Dans cet exemple de jouet, il y a deux prédicteurs et x 2 et une variable de réponse y . La direction en Xx1 x2 y X qui est le plus corrélé avec arrive à être perpendiculaire à la direction de la variance maximale dans X . Par conséquent, PC1 est orthogonal au premier axe RRR et l'axe PLS est quelque part entre les deux.y X
On peut ajouter une pénalité de crête à la fonction perdue RRR en obtenant une régression de rang réduit de crête, ou RRRR. Cela tirera l'axe de régression vers la direction PC1, quelque peu similaire à ce que fait PLS. Cependant, la fonction de coût pour RRRR ne peut pas être écrite sous forme PLS, elles restent donc différentes.
la source