Je suis très nouveau avec R et les statistiques en général, mais je dois faire un nuage de points qui, je pense, pourrait dépasser ses capacités natives.
J'ai quelques vecteurs d'observations et je veux faire un nuage de points avec eux, et chaque paire appartient à une catégorie sur trois. Je voudrais faire un nuage de points qui sépare chaque catégorie, soit par couleur soit par symbole. Je pense que ce serait mieux que de générer trois diagrammes de dispersion différents.
J'ai un autre problème avec le fait que dans chacune des catégories, il y a de grands groupes à un moment donné, mais les groupes sont plus grands dans un groupe que dans les deux autres.
Quelqu'un connaît-il une bonne façon de procéder? Paquets que je dois installer et apprendre à utiliser? Quelqu'un a fait quelque chose de similaire?
Merci
C'est l'un des problèmes classiques de l'ensemble de données «Iris». Il s'agit d'un lien vers tout un ensemble de projets de traçage basés sur cet ensemble de données avec le code R, que vous pourrez peut-être adapter à votre problème.
Voici une approche qui utilise avec la base R plutôt qu'avec un module complémentaire.
ce qui produit ce chiffre:
À partir de là, en fonction de votre intrigue, vous pouvez commencer à jouer avec les niveaux alpha / transparence pour permettre le surplotage, etc. mais je construirais d'abord à partir d'un graphique très basique.
Bien qu'il existe de nombreuses raisons de s'en tenir à la base R, d'autres packages simplifient le traçage. La séparation des données par une caractéristique distinctive est l'une des forces des packages ggplot2 et treillis . ggplot2 crée des graphiques particulièrement attrayants. Les deux packages sont illustrés dans la réponse de @cbeleites.
la source
Ou avec ggplot2:
Qui produit
la source