Bonne ressource en ligne avec des conseils sur l'association graphique entre deux variables numériques dans diverses conditions

22

Le contexte:

Au fil du temps, j'ai acquis un ensemble d'heuristiques sur la façon de tracer efficacement l'association entre deux variables numériques. J'imagine que la plupart des gens qui travaillent avec des données auraient un ensemble de règles similaire.

Des exemples de telles règles peuvent être:

  • Si l'une des variables présente une asymétrie positive, envisagez de tracer cet axe sur une échelle logarithmique.
  • S'il y a beaucoup de points de données (par exemple, n> 1000), adoptez une stratégie différente telle que l'utilisation d'une certaine forme de transparence partielle ou l'échantillonnage des données;
  • Si l'une des variables prend un nombre limité de catégories discrètes, envisagez d'utiliser une parcelle de gigue ou de tournesol;
  • S'il y a trois variables ou plus, envisagez d'utiliser une matrice de nuage de points;
  • L'ajustement d'une certaine forme de ligne de tendance est souvent utile;
  • Ajustez la taille du caractère de traçage à la taille de l'échantillon (pour un n plus grand, utilisez un caractère de traçage plus petit);
  • etc.

Question:

J'aimerais pouvoir renvoyer les étudiants vers une page Web ou un site qui explique ces astuces et d'autres pour tracer efficacement les associations entre deux variables numériques, peut-être avec des exemples.

  • Y a-t-il des pages ou des sites sur Internet qui font un bon travail à ce sujet?
Jeromy Anglim
la source
2
Si vous pouvez le trouver, le manuel "Graphics" imprimé fourni avec les anciennes copies de Systat (pré-Windows, croyez-le ou non) serait une excellente ressource. Non seulement il a illustré toutes ces règles (si je me souviens bien), mais il était plein de pilosité et d'excellents conseils.
whuber
2
@whuber, un excellent commentaire. Leland Wilkinson, l'auteur principal de Systat, et également l'auteur de The Grammar of Graphics (qui est plus un livre d'informatique qu'un livre de statistiques), a un goût très fin pour l'affichage graphique des données. Ses présentations sont toujours très efficaces pour transmettre leurs messages.
StasK
@ Jeromy, vous connaissez peut-être déjà le paquet ggplot2 pour R, mais maintenant que The Grammar of Graphics a été mentionné, j'ai pensé le mentionner aussi. Je trouve le package, le livre et le manuel de référence en ligne de Hadley Wickham très utiles pour transformer des variables numériques en graphiques et graphiques utiles.
NRH
1
@ Jeromy pourquoi ne pas reformuler la question (séparément) en wiki communautaire, en demandant un post par règle? De cette façon, plutôt qu'un ensemble de liens, nous pourrions avoir un ensemble de règles votables et créer la ressource ici.
David LeBauer
@David D'accord, j'ai ajouté une question générale du wiki de la communauté sur les meilleures ressources pour la conception de parcelles stats.stackexchange.com/questions/16631/…
Jeromy Anglim

Réponses:

13

Brendan O'Connor et Lukas Biewald's, Brendan O'Connor et Lukas Biewald, ne me permettent pas de penser à d'excellentes ressources en ligne . chapitre (avertissement: le lien est directement vers un PDF) de Beautiful Data . Le chapitre est particulièrement utile comme ressource pédagogique car il incorpore le code R dans le récit.

De plus, après réflexion, je pense que le classique "Some Graphic and Semigraphic Displays" de John Tukey (commodément publié sur le site Web d'Edward Tufte) est une introduction vraiment merveilleuse, quoique quelque peu idiosyncratique, à la visualisation.

Pour une raison quelconque, je pense penser aux chapitres de livres ...

ashaw
la source
+1 Au moins ces chapitres sont disponibles sur le Web: je pense que ça se qualifie. Merci, Aaron.
whuber
@ whuber merci d'avoir posté la prime; et @ashaw les deux liens rendent la lecture intéressante.
Jeromy Anglim
Je remarque que l'article de Tukey est un prédécesseur du traitement élargi trouvé dans son livre EDA (1977) (à l'exception de la dernière section sur les rootogrammes et histogrammes suspendus).
whuber
11

Références récentes:

Des ressources plus anciennes mais pertinentes

David LeBauer
la source
3
+1 Les règles et les didacticiels semblent utiles, complets et interdits! Comment est-il possible d'écrire sur des graphiques sans fournir une seule illustration ? :-)
whuber
1
Le choix a été difficile, mais j'ai récompensé cette réponse car dans l'ensemble, elle répond le mieux à la question telle qu'elle a été posée. Le document de l'ONU semble être particulièrement utile et accessible aux étudiants, avec son langage clair et de nombreux exemples clairs.
whuber