Dans quelles conditions l'analyse des composants principaux (ACP) et l'analyse factorielle (AF) devraient-elles donner des résultats similaires?
pca
factor-analysis
Statistiques
la source
la source
p-m
derniers composants principaux - ceux que vous supprimez dans l'ACP (p
c'est le nombre de variables etm
le nombre de composants ou de facteurs que vous avez décidé d'extraire). Sip
sont grandes; 2) le bruit est faible pour toutes les variables; 3) le bruit est à peu près égal pour toutes les variables.Réponses:
C'est une excellente question, mais malheureusement (ou peut-être heureusement?) Je n'ai écrit que très récemment une très longue réponse dans un fil connexe , répondant à votre question presque exactement. Je vous demanderais de bien vouloir y regarder et voir si cela répond à votre question.
Très brièvement, si nous nous concentrons uniquement sur les chargements PCA et FAW , alors la différence est que PCA trouve W pour reconstruire la matrice de covariance (ou corrélation) de l'échantillon C aussi proche que possible:
Dans cet esprit, la réponse à votre question devient facile à voir. Si le nombren de variables (taille de C ) est grande, la partie hors diagonale de C est presque toute la matrice (la diagonale a la taille n et toute la taille de la matrice n2 , donc la contribution de la diagonale est seulement 1/n→0 ), et nous pouvons donc nous attendre à ce que PCA se rapproche bien de FA. Si les valeurs diagonales sont plutôt petites, alors encore une fois, elles ne jouent pas beaucoup de rôle pour PCA, et PCA finit par être proche de FA, exactement comme @ttnphns l'a dit ci-dessus.
Si, en revanche,C est soit petit soit fortement dominé par la diagonale (en particulier s'il a des valeurs très différentes sur la diagonale), alors l'ACP devra biaiser W vers la reproduction de la diagonale également, et finira donc par être très différent de FA. Un exemple est donné dans ce fil:
la source