La surface ou la longueur d'un carré doit-elle être proportionnelle aux données visualisées?

16

Je fais une visualisation des données. Chaque donnée est représentée par un carré. Pour rendre les données sous-jacentes lisibles intuitivement, la longueur du côté ou de la surface de chaque carré doit-elle être proportionnelle à la donnée qu'elle représente?

dumbledad
la source
1
Pas encore. Est-ce large? J'espérais que la réponse était définitive (je suppose que c'est "la zone") mais que les gens d'ici auraient plus de connaissances en conception graphique et en psychologie perceptuelle pour étayer cela.
dumbledad
1
IIRC cela a été couvert dans un livre allemand que j'ai lu une fois, "So lügt man mit Statistik" par en.wikipedia.org/wiki/Walter_Krämer - je ne sais pas s'il y a un équivalent anglais. TL; DR - dépend de ce que vous voulez que vos lecteurs lisent à partir des visualisations.
Michael Schumacher
La réponse n'est certainement pas définitive. Tout dépend des détails - à savoir quelles sont les données que vous présentez, comment vous présentez et ce que vous souhaitez communiquer avec ces données.
DA01
Pouvez-vous donner des exemples où les détails ou ce que nous voulons que les lecteurs lisent à partir de la visualisation nous amèneraient à choisir de rendre la longueur du côté d'un carré proportionnelle à la donnée au lieu de l'aire du carré?
dumbledad
5
+1 Pourquoi chaque question intéressante attire-t-elle au moins un vote serré?!? <grump>
user56reinstatemonica8

Réponses:

10

Si vous, le créateur, n'êtes pas sûr, comment le lecteur saura-t-il de quoi il s'agit?

Réponse courte: la valeur doit être liée 1: 1 à la quantité de couleur sur la page . Donc, dans votre exemple, ce devrait être une zone. Mais il y a plus que cela: vous devez également éviter les indices trompeurs qui pourraient inciter un lecteur à le lire incorrectement, et vous devez savoir pourquoi vous utilisez la zone au lieu de la longueur (par exemple, les graphiques à barres), car elle présente de réels avantages et inconvénients.


Premièrement, ne modifiez jamais la longueur et la largeur (c'est-à-dire l'aire) d'un changement de forme alors qu'en réalité la variable n'est liée qu'à la longueur d'un côté. Si X est double Y mais Y a quatre fois plus de couleurs sur la page, vous induisez vos lecteurs en erreur. Ce type de distorsion est parfois appelé « facteur de mensonge » et est souvent supposé être une tentative délibérée d'induire en erreur et d'exagérer les différences.

entrez la description de l'image ici


Si vous utilisez la zone comme mesure, je recommande fortement:

  • Savoir pourquoi vous utilisez la zone . En utilisant l'aire au lieu d'une dimension linéaire comme la longueur, vous:

    • Sacrifiez la capacité de voir clairement les différences mathématiquement (vous ne pouvez pas facilement dire "regardez, c'est le double de l'autre")
    • Invitez vos lecteurs à le voir de manière intuitive et non numérique au quotidien, comme les gens, par exemple, comparent les tailles de tartes dans un magasin. Moins sophistiqué, mais plus immédiat. Plus d'intestin, moins de tête.
    • De petites différences entre des nombres très similaires deviennent presque invisibles.
    • Lorsqu'une variable est beaucoup plus petite qu'une autre, la très petite ne disparaît pas aussi mal qu'elle le ferait dans un graphique à barres, ce qui peut permettre plus de flexibilité dans les dispositions.

entrez la description de l'image ici

  • Envisagez d'utiliser des cercles pour la zone, pas des carrés, alignés au centre :

    • Cercles car il n'invite pas à la confusion avec les graphiques à barres et similaires. La hauteur et la largeur sont moins importantes: il semble moins que vous invitiez une comparaison basée sur la hauteur ou la largeur.
    • Aligné au centre car il n'invite pas les gens à comparer les hauteurs

entrez la description de l'image ici

Par exemple, ci-dessus, il est difficile de ne pas voir le carré étiqueté "5" comme étant aux trois quarts de la hauteur du carré étiqueté "10", il est donc potentiellement trompeur.

Les cercles n'invitent pas à ce genre de comparaison: il s'agit plutôt d'un instantané au niveau de l'intestin "Ce blob est plutôt beaucoup plus gros que le prochain blob".


Il existe une variété de preuves, des tests des utilisateurs aux études à petite échelle (essaieront de rechercher des exemples plus tard) que ce type de comparaison intuitive par zone peut être plus engageant, peut abaisser la barrière à l'entrée à un public moins engagé et peut aider à garder l'attention du lecteur sur le sujet plutôt que sur la minutie froide des chiffres. Mais cela se fait au détriment d'une analyse plus numérique.

Ne choisissez pas entre une dimension (longueur ou distance) et deux dimensions (surface) pour des raisons esthétiques: choisissez entre elles en fonction de votre audience et de votre message.

Qu'est-ce qui est le plus approprié pour la communication: des comparaisons instantanées au niveau de l'intestin au niveau de "c'est beaucoup plus grand", ou des comparaisons numériques plus considérées au niveau de "c'est environ 80% de l'autre"?

Ou y a-t-il des raisons pratiques pour lesquelles vous devez utiliser la zone?

Ensuite, lorsque vous avez choisi pour des raisons pratiques , appliquez l'esthétique.

user56reinstatemonica8
la source
Le «proportionnel à la quantité de couleur sur la page» est une règle empirique très utile (au moins en 2D); merci pour ça je vais l'utiliser. La conception vers laquelle je me déplace est basée sur des cercles, je pense que vous êtes juste là
dumbledad
5

Je dirais la région. Optiquement, un carré avec un côté deux fois plus long montre une zone 4 fois plus grande. Les observateurs occasionnels se rapporteront à la région, même sans lire votre légende.

Un bel exemple est ce graphique légendaire de Randall Munroe de xkcd :

entrez la description de l'image ici ( version énorme et lisible )

Vincent
la source
4

Nous ne sommes pas aussi bons pour juger des différences dans le domaine que dans la longueur. Nous utilisons la longueur comme proxy et avons donc tendance à sous-estimer les différences de zones.

Pour cette raison, un cercle qui a en réalité 2x l'aire d'un autre semble trop petit parce que notre cerveau relie leurs rayons, qui diffèrent par un facteur de 1,4x.

Il existe des tentatives intéressantes pour réconcilier ce phénomène, comme la cartographie proportionnelle des symboles dans R , qui propose une mise à l'échelle perceptuelle des symboles pour mieux s'aligner sur la façon dont nous jugeons les longueurs et les zones.

Voici la figure 2 de cet article

entrez la description de l'image ici

Personnellement, je n'ai aucune expérience dans ce domaine et évite d'utiliser des domaines si des jugements quantitatifs sont nécessaires.

Une tangente intéressante est la relation entre la perception du volume et la longueur. La différence dans la façon dont nous les percevons est encore plus frappante. Cela peut être illustré dans cette vidéo de comparaisons de tailles d'étoiles .

Au moment où vous arrivez à la plus grande étoile, qui fait environ 1700x le diamètre du soleil, vous avez l'impression qu'elle est beaucoup plus grande que 1700x.

Pour un examen plus systématique de notre erreur dans la perception des différences de zones et de longueurs, voir Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design de Jeffrey Heer et Michael Bostock.

Martin Krzywinski
la source
4

À mon avis, la zone (D), pas chaque côté (E).

Si vous utilisez un côté de longueur 2, alors la zone serait 4 fois la valeur et vous auriez un graphique très chevauché. (E)

Lorsque vous avez un graphique à barres normal (A), les données sont linéaires et le avec de la barre est juste pour l'esthétique. (B)

Dans ces cas, la zone est à nouveau représentative des données car le avec des barres est le même. Vous pouvez avoir une barre 3D et le volume de la barre est toujours celui représentant les données (C)

Graphiques illustrant le dimensionnement des différences de perception et du chevauchement

Rafael
la source
4 fois? N'est-ce pas la différence entre linéaire et carré?
dumbledad du
Permettez-moi d'illustrer et de modifier le message.
Rafael
Supposons que la donnée soit de 81. Si nous utilisons la zone, les côtés ont une longueur de 9 donnant une zone de 81. Si nous faisons des côtés, ils sont de longueur 81 et la zone est de 6 561. 81 n'est pas 4 fois 9 et 6 561 n'est pas 4 fois 81. D'où obtenez-vous 4?
dumbledad
"Si vous utilisez un côté de longueur 2, alors la zone serait 4 fois la valeur" Je ne peux pas dire ce que vous essayez de dire là-bas. Je pense que vous voulez dire que, si vous utilisez la longueur du côté pour représenter l'ampleur des données, doubler la valeur des données multiplie la zone par quatre.
David Richerby
David - c'est mon montage! Le message original de Rafael disait "si vous utilisez un côté, la zone serait 4 fois la valeur". Si vous connaissez une meilleure façon de clarifier cela, veuillez le faire.
dumbledad
1

Tufte a traité cette question de manière approfondie. Voir:

  • L'affichage visuel des informations quantitatives,
  • Envisager des informations et autres.

Quelques principes d'intégrité graphique:

  1. La représentation des nombres, telle que mesurée physiquement sur la surface du graphique lui-même, doit être directement proportionnelle aux quantités numériques représentées
  2. Un étiquetage clair, détaillé et approfondi doit être utilisé pour éliminer la distorsion graphique et l'ambiguïté. Écrivez les explications des données sur le graphique lui-même. Étiquetez les événements importants dans les données.
  3. Afficher la variation des données, pas la variation de conception.
  4. Dans les séries monétaires en série chronologique, les unités de mesure monétaire dégonflées et normalisées sont presque toujours meilleures que les unités nominales.
  5. Le nombre d'informations portant des dimensions (variables) représentées ne doit pas dépasser le nombre de dimensions dans les données. Les graphiques ne doivent pas citer des données hors contexte.

Dans votre cas, vous devez vous demander si les données sont mieux représentées par une image 2D ou 3D ou une ligne. Un cube, un carré et une ligne ne sont pas identiques. C'est l'une des raisons pour lesquelles les graphiques à barres 3D trompent si souvent.

Mayo
la source