Je voudrais obtenir une représentation graphique des corrélations dans les articles que j'ai rassemblés jusqu'à présent pour explorer facilement les relations entre les variables. J'avais l'habitude de dessiner un graphique (désordonné) mais j'ai trop de données maintenant.
En gros, j'ai une table avec:
- [0]: nom de la variable 1
- [1]: nom de la variable 2
- [2]: valeur de corrélation
La matrice "globale" est incomplète (par exemple, j'ai la corrélation de V1 * V2, V2 * V3, mais pas V1 * V3).
Existe-t-il un moyen de représenter graphiquement cela?
la source
ggfluctuation
, je n'avais jamais vu ça avant! Cet article contient un autre code utile pour visualiser ce type de dateur: stackoverflow.com/questions/5453336/…hclust(…)$order
) [ stat.ethz.ch/R-manual/R-devel/library/stats/html/hclust.html] la visualisation sera souvent plus facile à visualiser.mixOmics::cim
fonction est très bonne pour ça. Un problème connexe a été discuté ici, stats.stackexchange.com/questions/8370/… .Vos données peuvent être comme
Vous pouvez réorganiser votre longue table en une table large avec le code R suivant
Vous obtenez
Vous pouvez maintenant utiliser des techniques pour visualiser les matrices de corrélation (au moins celles qui peuvent faire face aux valeurs manquantes).
la source
reshape
package peut également être utile. Une fois que vous aveze
, pensez à quelque chose commelibrary(reshape) cast(melt(e), name1 ~ name2)
Le
corrplot
package est une fonction utile pour visualiser les matrices de corrélation. Il accepte une matrice de corrélation comme objet d'entrée et dispose de plusieurs options pour afficher la matrice elle-même. Une fonctionnalité intéressante est qu'il peut réorganiser vos variables en utilisant un clustering hiérarchique ou des méthodes PCA.Voir la réponse acceptée dans ce fil pour un exemple de visualisation.
la source