Les quadrillages et les arrière-plans gris sont-ils indésirables et doivent-ils être utilisés uniquement à titre exceptionnel?

26

Il semble que la plupart des autorités s'accordent à dire que les lignes de quadrillage sombres ou autrement proéminentes dans les tracés sont «indésirables» selon toute définition raisonnable et distraient le spectateur du message dans le corps principal du graphique. Je ne prendrai donc pas la peine de donner des références sur ce point.

De même, nous pouvons tous convenir qu'il y aura des moments que pâles quadrillages pour créer une référence pour les téléspectateurs seront nécessaires. Tufte a fait valoir la nécessité (et utilisé) des lignes de grille de temps en temps, comme indiqué dans cet article . Et je suis d'accord avec l'approche de Hadley Wickham dans ggplot2 pour rendre ces quadrillages blancs sur un fond gris pâle, lorsque vous devez les utiliser.

Cependant, je ne suis pas sûr de savoir si ces lignes de grille et fond gris devraient être la valeur par défaut , comme ils le sont dans ggplot2. Par exemple, il ne semble pas y avoir d'autre raison pour le fond gris que de mettre en relief les quadrillages blancs - ce qui soulève la question de savoir si l'un ou l'autre est nécessaire. J'ai récemment commencé à utiliser ggplot2 pour la plupart de mes besoins graphiques et je pense que c'est génial, mais cela a remis en question mon approche "sans boîte, sans arrière-plan, sans quadrillage" des graphiques que j'utilisais auparavant. Je pensais que cela gridlines=OFFdevrait être ma valeur par défaut, sauf s'il y a une raison particulière de les ajouter - essentiellement l'approche recommandée dans cet article , par exemple.

Bien sûr, il est simple de définir un thème dans ggplot2 pour éviter les quadrillages et les ombrages d'arrière-plan (et en fait, nous l'avons fait dans mon travail), mais l'approche de ggplot2 est tellement géniale et généralement ses choix esthétiques par défaut sont bons que je me demande si Il me manque quelque chose.

Donc - je serais reconnaissant pour toute référence sur ce point. Je suis sûr qu'il a été bien réfléchi (par exemple par Hadley Wickham pour définir les paramètres par défaut de ggplot2) et je suis très ouvert à être pointé dans la bonne direction. Le meilleur que j'ai pu trouver est quelques liens sur le groupe Google ggplot2, mais la référence la plus utile de Cleveland n'est pas disponible sur le lien donné.

Peter Ellis
la source
7
Personnellement, j'aime les lignes de quadrillage (faibles) pour la raison évidente - pour faciliter l'estimation des valeurs associées aux points sur le graphique.
mark999
7
De la p. 141 du livre de Hadley: "Nous pouvons toujours voir les lignes de quadrillage pour aider au jugement de la position (Cleveland, 1993b), mais elles ont peu d'impact visuel et nous pouvons facilement les" régler ". Le fond gris donne à l'intrigue une couleur similaire (dans un sens typographique) au reste du texte, en veillant à ce que les graphiques s'inscrivent dans le flux d'un texte sans sauter avec un fond blanc brillant. Enfin, le fond gris crée un champ de couleur continu qui garantit que l'intrigue est perçue comme une entité visuelle unique. "
mark999
4
Andrew Gelman a fait beaucoup de blogs sur l'infographie, dans la même veine. Personnellement, je pense que les graphiques sans lignes de référence sont tout aussi mauvais que les grilles audacieuses et distrayantes. Plus élégant et cool, mais toujours interférant avec la compréhension et notre capacité à approfondir les informations. L'idée n'est pas d'être minimaliste, comme si nous étions tous des designers de meubles scandinaves, mais de communiquer clairement, ce qui devrait inclure des lignes de référence subtiles (mais utiles).
Wayne
3
Je remarque qu'il y a beaucoup de bonnes discussions ici, mais tous dans les commentaires - je me demande dans quelle mesure une réponse unique et faisant autorité peut être fournie - je soupçonne que cette question serait la meilleure en tant que CW, et ensuite nous pourrions avancer (et élaborer ) certains de ces bons commentaires en réponses.
gung - Réintégrer Monica
1
J'ai ajouté une réponse en me basant sur certains commentaires et je l'ai convertie en wiki communautaire
Peter Ellis

Réponses:

15

Une chose qui peut aider à faire avancer le débat est de reconnaître ce qui fait que les gens distinguent visuellement l'arrière-plan et le premier plan, en tirant des leçons de la cartographie et en l'appliquant plus généralement à n'importe quel graphique statistique.

Les gens peuvent initialement penser que la couleur est un bon indice pour savoir si un objet spécifique est au premier plan ou à l'arrière-plan, mais ce n'est pas le cas. Prenons par exemple cet exemple ci-dessous, extrait d'un article de blog de l'ESRI, Make Maps People Want to Look At: Five primary princesses design for cartography by Aileen Buckley.

confusion au premier plan

Donc, si je vous demandais de dire quel est le chiffre (par exemple la masse terrestre) et lequel est le sol (par exemple le plan d'eau), lequel choisiriez-vous? Un phénomène similaire se produit également avec le vase Rubin illusion d'optique du .

Quelques recherches expérimentales dont je me souviens avoir lu dans How Maps Work d' Alan MacEachren suggèrent que dans les images ci-dessus, les gens choisissent les zones claires et sombres à une fréquence égale pour la figure (apparemment la teinte et la saturation des couleurs sont utilisées pour déterminer la figure à partir du sol). Ainsi, la couleur ne peut pas intrinsèquement déterminer si l'arrière-plan est en concurrence avec le premier plan dans un graphique statistique, mais d'autres indices peuvent aider.

Les gens associent souvent les figures en tant qu'objets fermés (cela fait partie de la raison pour laquelle la carte ci-dessus prête à confusion, en ce sens qu'aucune masse n'est enfermée). Cela suggère en général (quelle que soit la couleur d'arrière-plan), les éléments de l'intrigue doivent avoir des limites clairement délimitées et les éléments de l'intrigue doivent être plus sombres que l'arrière-plan. Cela biaise probablement le fond du tracé de facto au blanc, mais avoir un fond gris n'est pas accablant. D'autres aspects peuvent être utilisés pour délimiter le premier plan et l'arrière-plan (le blog ESRI en mentionne quelques-uns).

L'une est l'ombre portée Excel détestée pour les graphiques ( exemple donné ici dans ce bulletin par Dan Carr à la figure 2). Bien que cela devrait venir avec la mise en garde que les gens peuvent interpréter les attributs numériques à l'emplacement de l'ombre au lieu de l'élément prévu.

Un autre utilise différentes couleurs / saturation pour le contour d'un élément dans l'intrigue par rapport au remplissage intérieur. Des exemples sont donnés ci-dessous, avec le cercle le plus à gauche un exemple d'une frontière pas clairement délimitée.

remplir vs contour

Ceux-ci ne semblent pas non plus exhaustifs. Pour les tracés de ligne, il apparaît fréquemment que des lignes plus épaisses viennent au premier plan, tandis que des lignes plus minces reculent à l'arrière-plan.

Ceci est principalement destiné à alimenter la réflexion: votre auto-étude semble être assez exhaustive (et je vous remercie pour certaines des ressources que vous avez fournies!) Je ne pense pas être en désaccord avec l'une des ressources que vous avez fournies, mais je ne suis pas sûr de comprendre de quoi Hadley parle avec sa motivation pour un fond gris par défaut. Mais la préférence esthétique personnelle pour les arrière-plans gris peut être prise en compte en veillant à ce que les éléments de l'intrigue soient au premier plan (c'est ce qui compte vraiment). Ces leçons peuvent également être appliquées aux quadrillages, et si les quadrillages aident et sont discrets (c'est-à-dire en arrière-plan), ils ne sont certainement pas indésirables.

Andy W
la source
5
Je ne pense pas que la question principale soit de faire la distinction entre l'arrière-plan et le premier plan - je pense que c'est assez simple. Le vrai défi est de créer le graphique de manière à rendre aussi facile et précis que possible les comparaisons qui vous intéressent. D'après mon expérience, les lignes de la grille facilitent la lecture et la comparaison des valeurs - bien que je ne le fasse pas avoir une expérimentation formelle pour appuyer cela.
hadley
@hadley, j'ai supposé que les (principales) plaintes concernant les arrière-plans gris (et les quadrillages) étaient qu'ils étaient envahissants, ce qui suggère qu'ils rivalisent d'attention avec les éléments de données réels de l'intrigue. Cela me suggère une confusion de premier plan / arrière-plan. Mes hypothèses peuvent être fausses également (peut-être que ce sont des raisons purement esthétiques que les gens préfèrent ou n'aiment pas). La distinction entre le premier plan et l'arrière-plan peut être simple, mais je ne pense pas que ce soit de notoriété publique, j'espère donc que mon message sera utile à cet égard.
Andy W
11

Le professeur Wickham a écrit dans le livre ggplot2:

"Nous pouvons encore voir les lignes de quadrillage pour aider au jugement de position (Cleveland, 1993b), mais elles ont peu d'impact visuel et nous pouvons facilement les" régler ". Le fond gris donne à l'intrigue une couleur similaire (dans un sens typographique) ) dans le reste du texte, en veillant à ce que les graphiques s'inscrivent dans le flux d'un texte sans sauter avec un fond blanc brillant. Enfin, le fond gris crée un champ de couleur continu qui garantit que l'intrigue est perçue comme un seul entité visuelle. "

Et @Wayne a écrit:

"Personnellement, je pense que les graphiques sans lignes de référence sont tout aussi mauvais que les grilles audacieuses et distrayantes. Plus stylés et cool, mais qui interfèrent toujours avec la compréhension et notre capacité à explorer les informations. L'idée n'est pas d'être minimaliste, comme si étaient tous des designers de meubles scandinaves, mais à communiquer clairement, ce qui devrait inclure des lignes de référence subtiles (mais utiles) "

et @Peter Flom a écrit:

Je pense que les lignes de grille faibles devraient être la valeur par défaut dans un nuage de points; ils aident le lecteur; de même, les espaces vides entre les mots et la ligne de texte aident le lecteur. Mais je n'aime pas le fond gris. Je trouve ça distrayant. Après tout, le texte est généralement composé de lettres noires sur fond blanc.

Peter Ellis
la source
3

Bien que j'aie tendance à éviter l'arrière-plan gris par défaut, Hadley a peut-être choisi le gris pour permettre à l'utilisateur d'utiliser plus de couleurs saturées et claires pour afficher les données, ce qui peut ne pas sembler aussi efficace avec un fond blanc.

Nova
la source
Était-ce destiné à répondre à la question du PO, à un commentaire demandant des éclaircissements au PO ou à l'un des répondeurs, ou à une nouvelle question de votre part? Veuillez utiliser uniquement le champ "Votre réponse" pour fournir des réponses à la question d'origine. Vous pourrez commenter n'importe où lorsque votre réputation est> 50. Si vous avez une nouvelle question, cliquez sur le gris ASK QUESTION en haut de la page et posez-la là, alors nous pouvons vous aider correctement.
gung - Rétablir Monica
2
En fait, je pense que cela constitue une réponse à la question, au moins partiellement: il y a une discussion ici pour savoir si le fond gris constitue un graphique indésirable, et un raisonnement pour suggérer pourquoi il pourrait ne pas.
Silverfish
0

Personnellement, je préfère le thème dark-on-light theme_bw, ou même theme_minimal, au thème par défaut de ggplot2 - voir http://docs.ggplot2.org/current/ggtheme.html .

thème par défaut

Je trouve le fond gris du thème par défaut extrêmement gênant - mon œil est attiré par les blocs gris plutôt que par les points. Est-ce que cela arrive à quelqu'un d'autre? Par exemple, dans l'intrigue de jouets ci-dessus, mon œil est souvent attiré en bas à droite (où il n'y a pas de points de données).

(Ne serait-il pas intéressant de voir des enregistrements oculaires de personnes regardant ces parcelles?)

Personnellement, je préfère ceci:

dark-on-light theme_bw

... mais c'est très subjectif - je ne pense pas qu'il devrait y avoir une seule règle que tout le monde doit suivre.

Code pour ces parcelles:

library(ggplot2)

n <- 100
df <- data.frame(x=runif(n, max=10), epsilon=rnorm(n))
df$y <- 2 + df$x - 0.05*df$x^2 + df$epsilon

p1 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       ggtitle("Default Theme"))
ggsave("default_theme_example.png", p1, width=10, height=8)

p2 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       theme_bw() +
       theme(panel.border=element_blank()) +
       ggtitle("Custom Theme"))
ggsave("custom_theme_example.png", p2, width=10, height=8)
Adrian
la source