Quelqu'un peut-il m'aider à interpréter les scores PCA? Mes données proviennent d'un questionnaire sur les attitudes envers les ours. Selon les chargements, j'ai interprété l'une de mes principales composantes comme "la peur des ours". Les scores de cette composante principale seraient-ils liés à la façon dont chaque répondant se mesure à cette composante principale (s'il / elle obtient une note positive / négative)?
16
Réponses:
Fondamentalement, les scores des facteurs sont calculés comme les réponses brutes pondérées par les charges de facteurs. Vous devez donc examiner les chargements factoriels de votre première dimension pour voir comment chaque variable est liée à la composante principale. L'observation de charges positives (resp. Négatives) élevées associées à des variables spécifiques signifie que ces variables contribuent positivement (resp. Négativement) à cette composante; par conséquent, les personnes obtenant un score élevé sur ces variables auront tendance à avoir des scores factoriels plus élevés (ou plus faibles) pour cette dimension particulière.
Le dessin du cercle de corrélation est utile pour avoir une idée générale des variables qui contribuent "positivement" vs "négativement" (le cas échéant) au premier axe principal, mais si vous utilisez R, vous pouvez jeter un œil au package FactoMineR et la
dimdesc()
fonction.Voici un exemple avec les
USArrests
données:Comme le montre le dernier résultat, la première dimension reflète principalement les actes de violence (de toute nature). Si nous regardons la carte individuelle, il est clair que les États situés à droite sont ceux où ces actes sont les plus fréquents.
Vous pouvez également être intéressé par cette question connexe: Quels sont les scores des composantes principales?
la source
Pour moi, les scores PCA ne sont que des réarrangements des données sous une forme qui me permet d'expliquer l'ensemble de données avec moins de variables. Les scores représentent la relation entre chaque élément et la composante. Vous pouvez les nommer selon l'analyse factorielle, mais il est important de se rappeler qu'il ne s'agit pas de variables latentes, car l'ACP analyse toutes les variances dans l'ensemble de données, pas seulement les éléments communs (comme le fait l'analyse factorielle).
la source
Les résultats de l'ACP (les différentes dimensions ou composantes) ne peuvent généralement pas être traduits en un véritable concept. Je pense qu'il est faux de supposer que l'un des composants est la "peur des ours", qu'est-ce qui vous fait penser que c'est ce que le composant voulait dire? La procédure des composants principaux transforme votre matrice de données en une nouvelle matrice de données avec la même quantité ou moins de dimensions, et les dimensions résultantes vont de celle qui explique le mieux la variance à celle qui l'explique le moins. Ces composants sont calculés sur la base d'une combinaison des variables d'origine avec les vecteurs propres calculés. La procédure PCA globale convertit les variables originales en variables orthogonales (linéairement indépendantes). J'espère que cela vous aide à clarifier un peu la procédure du PCA
la source