Je fais une visualisation des données. Chaque donnée est représentée par un carré. Pour rendre les données sous-jacentes lisibles intuitivement, la longueur du côté ou de la surface de chaque carré doit-elle être proportionnelle à la donnée qu'elle représente?
16
Réponses:
Si vous, le créateur, n'êtes pas sûr, comment le lecteur saura-t-il de quoi il s'agit?
Réponse courte: la valeur doit être liée 1: 1 à la quantité de couleur sur la page . Donc, dans votre exemple, ce devrait être une zone. Mais il y a plus que cela: vous devez également éviter les indices trompeurs qui pourraient inciter un lecteur à le lire incorrectement, et vous devez savoir pourquoi vous utilisez la zone au lieu de la longueur (par exemple, les graphiques à barres), car elle présente de réels avantages et inconvénients.
Premièrement, ne modifiez jamais la longueur et la largeur (c'est-à-dire l'aire) d'un changement de forme alors qu'en réalité la variable n'est liée qu'à la longueur d'un côté. Si X est double Y mais Y a quatre fois plus de couleurs sur la page, vous induisez vos lecteurs en erreur. Ce type de distorsion est parfois appelé « facteur de mensonge » et est souvent supposé être une tentative délibérée d'induire en erreur et d'exagérer les différences.
Si vous utilisez la zone comme mesure, je recommande fortement:
Savoir pourquoi vous utilisez la zone . En utilisant l'aire au lieu d'une dimension linéaire comme la longueur, vous:
Envisagez d'utiliser des cercles pour la zone, pas des carrés, alignés au centre :
Par exemple, ci-dessus, il est difficile de ne pas voir le carré étiqueté "5" comme étant aux trois quarts de la hauteur du carré étiqueté "10", il est donc potentiellement trompeur.
Les cercles n'invitent pas à ce genre de comparaison: il s'agit plutôt d'un instantané au niveau de l'intestin "Ce blob est plutôt beaucoup plus gros que le prochain blob".
Il existe une variété de preuves, des tests des utilisateurs aux études à petite échelle (essaieront de rechercher des exemples plus tard) que ce type de comparaison intuitive par zone peut être plus engageant, peut abaisser la barrière à l'entrée à un public moins engagé et peut aider à garder l'attention du lecteur sur le sujet plutôt que sur la minutie froide des chiffres. Mais cela se fait au détriment d'une analyse plus numérique.
Ne choisissez pas entre une dimension (longueur ou distance) et deux dimensions (surface) pour des raisons esthétiques: choisissez entre elles en fonction de votre audience et de votre message.
Qu'est-ce qui est le plus approprié pour la communication: des comparaisons instantanées au niveau de l'intestin au niveau de "c'est beaucoup plus grand", ou des comparaisons numériques plus considérées au niveau de "c'est environ 80% de l'autre"?
Ou y a-t-il des raisons pratiques pour lesquelles vous devez utiliser la zone?
Ensuite, lorsque vous avez choisi pour des raisons pratiques , appliquez l'esthétique.
la source
Je dirais la région. Optiquement, un carré avec un côté deux fois plus long montre une zone 4 fois plus grande. Les observateurs occasionnels se rapporteront à la région, même sans lire votre légende.
Un bel exemple est ce graphique légendaire de Randall Munroe de xkcd :
( version énorme et lisible )
la source
Nous ne sommes pas aussi bons pour juger des différences dans le domaine que dans la longueur. Nous utilisons la longueur comme proxy et avons donc tendance à sous-estimer les différences de zones.
Pour cette raison, un cercle qui a en réalité 2x l'aire d'un autre semble trop petit parce que notre cerveau relie leurs rayons, qui diffèrent par un facteur de 1,4x.
Il existe des tentatives intéressantes pour réconcilier ce phénomène, comme la cartographie proportionnelle des symboles dans R , qui propose une mise à l'échelle perceptuelle des symboles pour mieux s'aligner sur la façon dont nous jugeons les longueurs et les zones.
Voici la figure 2 de cet article
Personnellement, je n'ai aucune expérience dans ce domaine et évite d'utiliser des domaines si des jugements quantitatifs sont nécessaires.
Une tangente intéressante est la relation entre la perception du volume et la longueur. La différence dans la façon dont nous les percevons est encore plus frappante. Cela peut être illustré dans cette vidéo de comparaisons de tailles d'étoiles .
Au moment où vous arrivez à la plus grande étoile, qui fait environ 1700x le diamètre du soleil, vous avez l'impression qu'elle est beaucoup plus grande que 1700x.
Pour un examen plus systématique de notre erreur dans la perception des différences de zones et de longueurs, voir Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design de Jeffrey Heer et Michael Bostock.
la source
À mon avis, la zone (D), pas chaque côté (E).
Si vous utilisez un côté de longueur 2, alors la zone serait 4 fois la valeur et vous auriez un graphique très chevauché. (E)
Lorsque vous avez un graphique à barres normal (A), les données sont linéaires et le avec de la barre est juste pour l'esthétique. (B)
Dans ces cas, la zone est à nouveau représentative des données car le avec des barres est le même. Vous pouvez avoir une barre 3D et le volume de la barre est toujours celui représentant les données (C)
la source
Tufte a traité cette question de manière approfondie. Voir:
Quelques principes d'intégrité graphique:
Dans votre cas, vous devez vous demander si les données sont mieux représentées par une image 2D ou 3D ou une ligne. Un cube, un carré et une ligne ne sont pas identiques. C'est l'une des raisons pour lesquelles les graphiques à barres 3D trompent si souvent.
la source