Rapport encre / données et arrière-plans du tracé

17

J'ai remarqué que de nombreux packages et thèmes de traçage "à la pointe de la technologie" et de nombreux utilisateurs de données distingués utilisent un fond gris pour leurs tracés. Voici plusieurs exemples:

ggplot2:

entrez la description de l'image ici

Le site fivethirtyeight.com de Nate Silver:

entrez la description de l'image ici

Alors que dans le premier exemple ci-dessus (ggplot2), on peut soutenir que l'utilisation d'un fond gris réduit l'encre nécessaire pour les lignes de grille, ce n'est certainement pas le cas avec le second cas. Quels sont les avantages d'utiliser un fond gris, par opposition à un fond blanc ou transparent?

David D
la source
2
Une intrigue est un plat servi - un fond gris est une assiette.
ttnphns
3
@ttnphns J'aime l'analogie. Hadley Wickham a déclaré à propos de l'arrière-plan de ggplot: "Le fond gris donne à l'intrigue une couleur similaire (dans un sens typographique) au reste du texte, garantissant que les graphiques s'inscrivent dans le flux d'un texte sans sauter avec un fond blanc brillant. Enfin, le fond gris crée un champ de couleur continu qui garantit que l'intrigue est perçue comme une entité visuelle unique. " Il a également justifié les quadrillages sur la base du fait qu'ils peuvent facilement être «effacés».
Silverfish
1
ttnphns J'aime aussi beaucoup votre analogie. @silverfish oui, exactement à droite, avec l'échelle de gris correspondant à un strabisme vos yeux et comparer le carré de l'intrigue avec le texte sur la page. Hadley a rendu le fond gris populaire. Sa conception avec l'arrière-plan gris mais le support blanc (axes) indique clairement où les données commencent et se terminent. Et les données ressortent avec plus de visibilité que la grille d'arrière-plan, qui suit de bons principes cognitifs. La grille reste en place jusqu'à ce que vous deviez l'utiliser pour rechercher des valeurs.
Dianne Cook du
3
@Silverfish Regardez d'abord Jacques Bertin ( Semiologie Graphique ), Alan MacEachran ( Comment fonctionnent les cartes ) et Lee Wilkinson ( The Grammar of Graphics ). MacEachran donne tous les détails physiologiques, psychologiques et culturels avec de nombreuses références. Ne vous laissez pas rebuter par la référence aux "cartes": son livre s'intéresse principalement à la façon dont les gens interagissent avec et créent du sens à partir des graphiques d'information en général, dont les cartes ne sont qu'un exemple saillant.
whuber
2
@silverfish Il est possible que le travail de dan carr, qui a commencé à utiliser le fond gris et les lignes de quadrillage blanches avec les tableaux pour tracer des travaux au début des années 90 dev.bowdenweb.com/maps/m/using-gray-in-plots.pdf soit la source de l'idée. Je connais Hadley et en ai discuté. Mais l'analogie avec l'échelle de gris de strabisme du texte est l'explication de Hadley.
Dianne Cook

Réponses:

18

Le rapport données-encre

Ce concept est dû au très influent Edward Tufte , de l'Université de Yale, qui l'a décrit dans The Visual Display of Quantitative Information .

Il distingue "l'encre de données" (qui comprend des points, des barres, etc. mais aussi des étiquettes textuelles ou graphiques) de l'encre effaçable (y compris le quadrillage, les axes, les bordures et également les informations redondantes). Le rapport données-encre est simplement la proportion d'encre utilisée qui ne peut pas être effacée.

Il y a une discussion sur la façon dont ces principes data-ink pourraient s'appliquer aux visualisations informatiques sur le site d'échange de pile UX .

Pourquoi certains experts préfèrent un fond gris?

Hadley Wickham a justifié son choix de fond par défaut, dans son livre sur ggplot2:

Le fond gris donne à l'intrigue une couleur similaire (dans un sens typographique) au reste du texte, garantissant que les graphiques s'inscrivent dans le flux d'un texte sans sauter avec un fond blanc brillant. Enfin, le fond gris crée un champ de couleur continu qui garantit que l'intrigue est perçue comme une entité visuelle unique.

Le principe semble être de l'empêcher de "sauter" au spectateur sur une page imprimée et de fournir une unité visuelle. Personnellement, j'aime aussi le reflet réduit de l'écran.

Il a également justifié les quadrillages blancs sur la base du fait qu'ils peuvent facilement être «effacés». Je suis d'accord avec Dianne Cook dans les commentaires que cela permet aux données de se démarquer au-dessus du quadrillage, ce qui réduit l'encombrement visuel. Les quadrillages blancs sont l'un des avantages d'un arrière-plan légèrement plus sombre - il est intéressant de noter que Tufte évite généralement les quadrillages là où ils ne sont pas nécessaires (ils ne comptent pas comme "encre de données") mais sur certains graphiques à barres grises, les quadrillages blancs se superposent . À certains égards, cet effet est similaire à ggplot2, mais met en fait les lignes de grille au premier plan , donnant aux barres une apparence "rayée". Un inconvénient particulier est que vous ne pouvez pas voir le quadrillage le plus haut au - dessus d' une barre,

Pourquoi certains experts préfèrent un fond blanc?

L'un des ggplot2fils les plus consultés sur Stack Overflow est " Comment puis-je changer la couleur d'arrière-plan? ", Ce qui suggère que la valeur par défaut n'est pas universellement populaire.

La couleur d'un élément peut apparaître très différemment selon la couleur d'arrière-plan sur laquelle il est affiché. Tufte en discute en fait dans le chapitre 5 "Couleur et information" de son livre Envisioning information mais ne le place pas dans le contexte, par exemple, d'un nuage de points. Maureen Stone, experte en couleurs et professeur auxiliaire à l'Université Simon Fraser, recommande fortement un fond blanc pour diverses raisons, notamment que la plupart des palettes de couleurs (dans vos exemples, utilisées pour indiquer l'espèce ou la division) ont été conçues avec un fond blanc (pour l'impression) à l'esprit. Leurs propriétés perceptives différeront sur un fond plus sombre. Elle suggère que le blanc a un avantage perceptuel, car notre perception des couleurs est relative au blanc "local", donc avoir un fond blanc visuellement disponible peut stabiliser notre perception.

Elle suggère également une raison plus pratique que je connais: l'utilisation d'un fond blanc vous permet d'optimiser un graphique à la fois pour l'affichage électronique et l' impression, plutôt que d'avoir à préparer une version imprimable différente.

Silverfish
la source
2
+1 pour la peinture (pour ainsi dire) des deux côtés du problème. J'avais entendu le raisonnement de Hadley mais je n'avais pas entendu celui de Stone * Fraser. Merci!
Wayne
8

Tant que l'arrière-plan est suffisamment clair pour offrir un bon contraste avec les marques de données, c'est surtout une question d'esthétique, qu'il soit blanc ou gris clair. Alors que la couleur d'arrière-plan est "encre" dans un certain sens, je ne pense pas qu'elle compte comme "encre" logiquement. Il n'y a pas de distraction proportionnelle d'un champ solide de gris clair.

Inversement, les lignes de la grille comptent comme une "encre" logique dans les deux cas. Même si les lignes de quadrillage blanches ne consommaient pas d'encre pour imprimer, elles brisent toujours l'arrière-plan et créent un travail de traitement visuel supplémentaire. Je dirais que les 538 lignes de grille prennent moins d'encre logique car elles ont moins de contraste.

xan
la source
"Je dirais que les 538 lignes de grille prennent moins d'encre logique ..." - Je suis d'accord, je trouve les lignes de grille par défaut ggplot2 extrêmement distrayantes. Dans l'exemple ggplot2 en haut de la question du PO, mes yeux sont attirés par le quadrillage plutôt que par les données.
Adrian