Quelle est la signification de la sortie factuelle R?

8

Qu'est-ce que tout cela signifie? Je suis un «noob» de l'analyse factorielle et même si j'ai lu un livre, il ne m'a pas tout dit apparemment.

Étant donné que la statistique du chi carré est si élevée et la valeur de p si faible, il semblerait que les données soient presque coplanaires (2 dimensions) dans l'espace à 6 dimensions. Pourtant, cela ne représente que 89,4% de la variance (est-ce que j'interprète ce droit?)

De plus, je pensais que les facteurs étaient orthogonaux l'un à l'autre, alors comment les deux facteurs peuvent-ils avoir des charges positives pour chaque variable?

Et que signifient les particularités?

> factanal(charges[3:8],2)

Call:
factanal(x = charges[3:8], factors = 2)

Uniquenesses:
      APT    CHELPG   Natural       AIM Hirshfeld       VDD 
    0.217     0.250     0.082     0.052     0.005     0.033 

Loadings:
          Factor1 Factor2
APT       0.609   0.642  
CHELPG    0.657   0.564  
Natural   0.571   0.769  
AIM       0.382   0.896  
Hirshfeld 0.910   0.408  
VDD       0.844   0.504  

               Factor1 Factor2
SS loadings      2.817   2.544
Proportion Var   0.470   0.424
Cumulative Var   0.470   0.894

Test of the hypothesis that 2 factors are sufficient.
The chi square statistic is 77.1 on 4 degrees of freedom.
The p-value is 7.15e-16 
>
David Shobe
la source
@SeanMurphy: Merci! Maintenant, je comprends que l'analyse factorielle «factorise» (approximativement) la matrice de données 160x6 en une matrice de scores 160x2 et une matrice de charges 2x6. La sortie me donne la matrice des chargements, mais je suis également intéressé par la matrice des scores. Comment est-ce que j'obtiens cela? De préférence sous une forme que je peux exporter et / ou tracer.
David Shobe

Réponses:

15

La statistique du chi carré et la valeur de p en fait testent l'hypothèse que le modèle correspond parfaitement aux données. Lorsque la valeur p est faible, comme c'est le cas ici, nous pouvons rejeter cette hypothèse - dans ce cas, le modèle à 2 facteurs ne correspond pas parfaitement aux données (c'est l'opposé de la façon dont il semble que vous interprétiez la sortie).

Il convient de noter que 89,4% de la variance expliquée par deux facteurs est très élevée, donc je ne sais pas pourquoi le «seul».

Les facteurs eux-mêmes ne sont pas corrélés (orthogonaux), mais cela ne signifie pas que les mesures individuelles ne peuvent pas être corrélées avec les deux facteurs. Pensez aux directions Nord et Est sur une boussole - elles ne sont pas corrélées, mais le Nord-Est `` se chargerait '' positivement sur les deux.

L'unicité est la variance de chaque élément qui n'est pas expliquée par les deux facteurs.

Ce lien pourrait être utile à votre interprétation.

Sean Murphy
la source