Quels attributs font une figure de «qualité professionnelle»?

35

J'ai entendu des gens dire que les parcelles produites par ORIGIN ont tendance à paraître polies et «professionnelles», contrairement aux parcelles produites par Mathematica. Cependant, la plupart des programmes de création de tracé sont tout à fait configurables et il va de soi que, avec les bons réglages pour des positions telles que l'emplacement et l'étiquetage des ticks, le choix des polices et des couleurs, l'alignement des étiquettes, etc., je devrais être en mesure de faire une figure avec Mathematica. / matplotlib / Gnuplot / etc. cela a l'air aussi bon que ceux qui viennent d'ORIGIN. Mais qu'est-ce que cela signifie pour un personnage d'être "professionnel" dans ce contexte?

En d’autres termes, si mon objectif est de créer les meilleures figures possibles à inclure dans un article scientifique, quels choix de conception sont généralement recommandés pour atteindre cet objectif? Évidemment, il faut choisir le type de graphique approprié , par exemple graphique à barres / graphique en dispersion, et échelle linéaire / logarithmique, mais ce sont des choix auxquels nous pensons toujours, quel que soit le programme de graphique que nous utilisons. Je suis plus intéressé par les choses auxquelles nous ne pensons pas normalement, qui sont normalement définies en fonction des valeurs par défaut de certains programmes de traçage, mais qui pourraient être modifiées pour améliorer l'aspect de l'intrigue.

David Z
la source
2
C’est peut-être hors sujet ici ... Je l’affiche pour sonder les limites des questions de visualisation des données acceptables (cf meta.scicomp.stackexchange.com/questions/55/… )
David Z
5
Compte tenu de la mauvaise qualité de nombreuses parcelles qui en font des publications scientifiques, il se peut que la définition de la communauté doive être améliorée!
David Ketcheson
2
@ David Zaslavsky - Je pense que c'est peut-être l'endroit le plus approprié pour cette question car il est spécifique à la présentation des données scientifiques, qui font partie de la science informatique. J'ai souvent vu des scientifiques se plaindre que les graphiques produits par notre logiciel ne répondent pas au "standard de publication" et doivent être modifiés, il serait donc agréable de voir les autres expériences de ce problème. Comme toujours avec les questions subjectives, les réponses doivent suivre les six directives .
Mark Booth
Bien sûr, @Mark. J'ai essayé de rendre cela aussi objectif que possible car ce n'était pas une question technique.
David Z
Merci David, mon commentaire visait davantage les réponses aux questions, car nous avions tendance à chercher des réponses courtes à l'époque. Les six lignes directrices préfèrent long sur court, expérience sur opinion, contexte sur hypothèse, impartialité sur préjugé, sérieux sur désinvolte et suggèrent de corroborer des réponses avec des faits et des références, etc. question.
Mark Booth

Réponses:

14

OMI, ce qui fait la qualité "professionnelle" est défini par les règles du journal / éditeur. Ce qui se traduit réellement par "qualité de publication" qui est relative selon l'endroit où vous publiez. Certaines règles universelles semblent se dégager - invariantes du logiciel de traçage utilisé:

1) Une figure doit contenir le moins d’éléments possible pour transmettre l’information / idée / argument. Une figure doit être facilement lisible / comprise en quelques secondes - si cela vous prend plus de temps pour comprendre ce qui se passe sur la figure, il se peut qu’il y ait trop d’informations. Cela est parfois difficile à vérifier car vous connaissez votre parcelle / vos propres données - peu importe leur encombrement excessif - le montrer à quelques collègues pour savoir s’ils peuvent le lire facilement peut être utile. (à ne pas confondre avec la compréhension de la signification physique derrière la figure - cela prend généralement un certain temps).

2) Si vous devez utiliser des couleurs, il est préférable de vous limiter à quelques-unes, idéalement du côté opposé de la roue chromatique. Par exemple, le bleu et le rouge sont meilleurs que le bleu et le vert. Une figure peut avoir plusieurs nuances - mais il est préférable d’avoir peu de couleurs principales. J'aime souvent utiliser le bleu (valeurs faibles) et le rouge (valeurs élevées) avec une transition blanche entre les deux. Ayez toujours à l'esprit les lecteurs daltoniens.

3) Les marques de graduation, les étiquettes de contour, etc. doivent tous être facilement lisibles sans loupe - donc, une taille de police similaire à celle du texte du corps du journal. Vous pouvez vérifier si tout est lisible en imprimant une copie papier avec des largeurs de 3 à 6 pouces (ce sont des tailles de figures courantes dans les revues scientifiques).

4) Enfin, assurez-vous que chaque élément de la figure a sa raison d'être. Si quelque chose ne transmet pas d'informations utiles, jetez-les. Cela facilitera la lisibilité de la figure.

Au moment où vous êtes à l'aise avec la personnalisation de tous les petits éléments qui composent un personnage - graduations, libellés, etc., le type d'outil utilisé n'a pas vraiment d'importance tant que vous êtes en mesure de produire un eps propre.

milancurcic
la source
Pouvez-vous préciser la raison de (1)? Quelques secondes, ce n'est pas long. Est-ce sur la base pragmatique que les gens sont vraiment très occupés, de sorte que s'il faut plus que quelques secondes pour comprendre le chiffre, ils ne vont pas s'en faire?
Faheem Mitha
@FaheemMitha Non, ce que je voulais vraiment dire, c'est que vous rendez service aux lecteurs si vous maintenez la figure claire et simple. Ne retenez pas quelques secondes comme critère solide - c’est comme cela que je suis habitué à évaluer mes propres chiffres. Il y a une limite à la quantité d'informations que vous pouvez mettre sur un chiffre - en en mettant trop, vous risquez de rendre le contenu difficile à comprendre pour le lecteur. Vos lecteurs se donneront la peine de lire des figures très occupées s’ils sont intéressés par votre travail - mais une figure moins occupée permet de mieux communiquer l’information.
milancurcic
Je ne suis pas sûr qu'il soit tout à fait logique d'accepter une réponse à une question aussi nébuleuse, mais cette réponse semble mieux codifier les idées vagues que j'avais en tête lorsque je l'ai posée. Donc, vous obtenez la coche :-)
David Z
18

Il y a quelques éléments que je recherche quand je considère quelque chose de «qualité de publication» dans mon propre travail ou ce que je considère comme regardant les autres. Elles sont:

  1. Haute résolution et de préférence vectoriel. Celui-ci devrait être assez évident maintenant, mais vous seriez surpris.
  2. Un manque d'encombrement. Je devrais pouvoir voir ce qui se passe dans votre personnage et le voir rapidement. Il ya peu de choses que je déteste plus que d’essayer de suivre le guide «Taux d’encre élevé: ratio papier» et de l’utiliser pour tenter d’entasser un manuscrit entier en une seule figure.
  3. Imprime bien. C’est celui qui est le plus important pour moi et lorsque j’examine des papiers, j’en teste toujours un. "Les chiffres sont-ils imprimés?" Plus d’une fois, j’ai frappé des personnages dont les points sont complètement obscurcis lorsqu’ils sont imprimés en niveaux de gris, ce qui les rend inutilisables pour mes besoins (je ne lis pas sur les écrans).
  4. Preuve que le créateur sait utiliser les paramètres graphiques. Pas de choix d'axes de bille impaire, de graduations au bon endroit, etc.
  5. Combiné avec # 2, un manque de "s'épanouir" qui est de nature entièrement graphique. Des ombres, des 3D inutiles, etc. qui ne font vraiment perdre du temps aux lecteurs.

La plupart de ceux-ci sont honnêtement spécifiques au créateur, plutôt que spécifiques au programme. J'ai vu des tracés terribles en R et d'excellents en Excel.

Fomite
la source
Les graphiques vectoriels sont en effet souhaitables. Mais existe-t-il des programmes de dessin largement utilisés qui ne le sont pas?
Faheem Mitha
2
Des programmes de dessin? Pas que je puisse penser. Des programmes qui produisent des parcelles - des progiciels statistiques et autres? Beaucoup d'entre eux ont des formats de sortie non vectoriels disponibles, ou par défaut.
Fomite
14

Si nous parlons de chiffres, j'aimerais aller aux sources: L'affichage visuel d'informations qualitatives et de belles preuves par Edward Tufte .

M. Tufte va bien sûr dans certains détails, mais le principe qui me caractérise n’est pas de dépenser de l’encre pour les encadrements ni les décorations, mais de faire en sorte que votre encre contienne le plus d’informations possible.

Modifié à la demande de Mark:

Les principaux points de l’ affichage visuel des informations qualitatives sont:

  • afficher les données de manière à ne pas fausser ou masquer ce qu'il a à dire
  • organiser des affichages pour permettre des comparaisons entre différentes données à différents niveaux
  • intégrer les aspects graphiques avec les descriptions statistiques et verbales
  • maximisez le rapport données / encre en supprimant les éléments inutiles (ou redondants par d'autres éléments) et utilisez les éléments existants pour véhiculer des informations supplémentaires (les axes constituant des variantes d'une boîte à moustaches, par exemple).
  • de petits multiples peuvent être utilisés pour organiser des ensembles de données de dimensions supérieures afin de permettre une comparaison le long de ces dimensions supplémentaires

Beautiful Evidence est un livre de portée plus large. Je vais simplement reproduire les titres de chapitres:

  • Images mappées: images en tant que preuves et explications
  • Lignes sparkline: graphiques intenses, simples et au format Word
  • Liens et flèches causales: l'ambiguïté en action
  • Mots, nombres, images - ensemble
  • Les principes fondamentaux de la conception analytique
  • Corruption dans les présentations de preuves: effets sans cause, cueillette de cerises, débordement, Chartjunk et la rage de la conclusion
  • Le style cognitif de PowerPoint: Pitching out Corrupts Within
  • Les socles sculpturaux: signification, pratique, dépédestalisation
  • Sculptures de paysage

Une des observations intéressantes dans Beautiful Evidence est que nous utilisons généralement des périphériques de sortie à haute densité (une imprimante 300 DPI est un périphérique à faible densité de nos jours) pour l'impression, mais nous dessinons souvent nos chiffres pour les imprimantes sérigraphiques ou linéaires, ce qui gaspille un potentiel énorme. pour transmettre des informations.

dmckee
la source
La page 13 de L’affichage visuel des informations quantitatives commence par un résumé succinct des «graphiques professionnels» ou, comme il est intitulé «Excellence graphique».
Brian Diggs
@ Brian Diggs - dmckee ou vous-même pourriez-vous mettre à jour cette réponse avec un résumé des points principaux? Beaucoup d'entre nous sont peut-être assez intéressés pour connaître le résumé sans être assez intéressés pour sortir et acheter les livres.
Mark Booth
@Mark: J'y reviendrai dans un jour ou deux… ma copie est au bureau et, pour le moment, je ne le suis pas.
dmckee
8

Les meilleurs chiffres que j'ai pu réaliser personnellement sont ceux du package TeX PGF / TikZ . Si vous utilisez LaTex, comme le font beaucoup de scientifiques, vous en avez probablement déjà entendu parler.

Il semble également être le leader des packages graphiques LaTex. Une proportion non négligeable des questions sur le site TeX StackExchange concerne PGF / TikZ. Je ne suis pas sûr de savoir pourquoi les résultats sont si bons, mais un des avantages de PGF / TikZ par rapport aux autres packages lors de l’utilisation de LaTeX est qu’il intègre simplement mieux le texte. D'une part, les polices de la figure seront les mêmes que dans le texte.

Faheem Mitha
la source
Bien sûr, c’est aussi ma façon préférée de faire des chiffres ;-) Mais je suis plus intéressé par la raison pour laquelle les parcelles TikZ sont considérées comme bonnes.
David Z
1
@ David Zaslavsky: Je ne sais pas. Till est un génie? :-)
Faheem Mitha
@ David Zaslavsky: Sérieusement, cette question concerne tout le sujet tex.sx, et a probablement déjà été abordée ici.
Faheem Mitha
1
@EpiGrad: Je voulais simplement dire que poser des questions sur TikZ serait plus utile sur tex.sx, si David y tenait tant. Bien sûr, la question plus large ne serait pas sur le sujet pour tex.sx.
Faheem Mitha,
1
pgfplots est assez incroyable. Par défaut, cela ressemble à peu près à ce que vous voulez, c’est-à-dire des étiquettes encadrées, vectorielles, cohérentes avec le corps du texte, et. Mais c'est aussi facile à ajuster. Mon astuce préférée consiste à extraire les axes d'un pseudo-tracé de couleurs Matlab, à le rogner, puis à envelopper les axes dans TikZ. De cette façon, vous obtenez une image raster pour la pseudo-couleur (c’est l’un des rares cas pour lesquels un graphique raster est préférable) et la qualité LaTeX pour les axes et les étiquettes, et même la barre de couleur. C’est l’une de mes réponses en utilisant pgfplots
qubyte
6

Il est presque plus facile de définir ce qui constitue un mauvais graphique que ce qui en fait un bon graphique.

Quelques caractéristiques des mauvais graphiques:

  • Polices et symboles excessivement grands ou petits
  • Lignes excessivement fines ou épaisses pour les courbes et autres éléments graphiques
  • Trop de variables différentes affichées ou modifiées en même temps
  • Avoir des sélections d’axes inappropriées (log versus linéaire, gamme, etc.)
  • Affichage des tendances entre les points de données avec des courbes pleines indiquant des progressions ou des comportements inexistants
  • Ne donnant aucune indication sur l'ampleur des incertitudes ou des erreurs
  • Graphiques mal libellés ou mal étiquetés (y compris les unités!)

En général, cependant, alors que la plupart des progiciels sont capables de créer de bons graphiques, presque aucun programme avec lequel j'ai travaillé ne passe par défaut à un état produisant de bons graphiques. Ils nécessitent toujours des ajustements: soit la taille de la police, soit la plage d'affichage, soit le choix des axes ou des symboles, etc. Actuellement, je préfère utiliser matplotlib; d'autres membres de mon groupe ont migré vers SciDavis.

aeismail
la source
Vous ne savez pas ce que vous entendez par "ne pas donner d'indication d'erreur". Pouvez-vous clarifier? Sinon, bonne liste.
Faheem Mitha
Édité pour plus de clarté: "Ne donnant aucune indication sur l'ampleur des incertitudes ou des erreurs." Cependant, lorsque les erreurs sont trop petites pour être affichées, cela peut être indiqué dans la légende.
aeismail
5

Le package Mathematica LevelScheme a connu un succès raisonnable . Son modèle d'exécution diffère légèrement de la programmation traditionnelle de Mathematica, de sorte qu'il existe une courbe d'apprentissage associée à son utilisation. Mais, il est capable de fournir un contrôle précis à la génération de parcelles de terrain, ce qui est difficile en Mathematica. En outre, en tant que package latéral, il existe un package permettant de générer des graduations personnalisées.

(Une fois la version prise en charge par Mathematica v.8, elle sera renommée SciDraw.)

révolter
la source