J'analyse un ensemble de données concernant les communautés intertidales. Les données sont le pourcentage de couverture (d'algues, bernaches, moules, etc.) en quadrats. J'ai l'habitude de penser à l'analyse des correspondances (AC) en termes de dénombrement des espèces et à l'analyse en composantes principales (ACP) comme quelque chose de plus utile pour les tendances environnementales linéaires (et non les espèces). Je n'ai pas vraiment eu de chance pour savoir si PCA ou CA seraient mieux adaptés à la couverture en pourcentage (je ne trouve aucun papier), et je ne sais même pas comment un produit plafonné à 100% serait distribué. ?
Je connais la ligne directrice approximative selon laquelle si la longueur du premier axe d'analyse de correspondance détendue (DCA) est supérieure à 2, vous pouvez supposer en toute sécurité que CA doit être utilisé. La longueur de l'axe 1 du DCA était de 2,17, ce que je ne trouve pas utile.
la source
Réponses:
PCA fonctionne sur les valeurs alors que CA travaille sur les valeurs relatives. Les deux sont parfaits pour les données d'abondance relative du type que vous mentionnez (avec une mise en garde majeure, voir plus loin). Avec% data, vous avez déjà une mesure relative, mais il y aura toujours des différences. Demande toi
S'il s'agit du premier, utilisez PCA. Si ces derniers utilisent CA. Ce que je veux dire par les deux questions, c'est si vous voulez
être considéré comme différent ou identique?
A
etB
sont deux échantillons et les valeurs sont le% de couverture de trois taxons indiqués. (Cet exemple s'est avéré médiocre, supposons qu'il y ait un sol nu! ;-) PCA les considérerait très différents en raison de la distance euclidienne utilisée, mais CA considérerait ces deux échantillons comme très similaires car ils ont le même profil relatif.La grande mise en garde ici est la nature fermée de la composition des données. Si vous avez quelques groupes (sable, limon, argile, par exemple) qui totalisent 1 (100%), aucune des deux approches n'est correcte et vous pouvez passer à une analyse plus appropriée via l'Aitch-ratio Log-ratio PCA qui a été conçu pour la composition fermée Les données. (L'IIRC pour ce faire, vous devez centrer par lignes et colonnes et enregistrer la transformation des données.) Il existe également d'autres approches. Si vous utilisez R, puis un livre qui serait utile est L' analyse compositionnelle données avec R .
la source