Il s'agit d'une question de visualisation des données - j'espère que vous pouvez la poser ici.
Quand est-il approprié d'utiliser un remplissage sous un graphique linéaire pour une série chronologique, comme le graphique ci-dessous? (qui affiche les temps de ping sur une journée)
Je suppose qu'il est plus courant d'utiliser une ligne simple, sans remplissage en dessous, mais est-il acceptable d'utiliser un remplissage pour la variété visuelle?
Je serais particulièrement intéressé à connaître toute recherche perceptuelle sur le sujet ou tout guide de style.
data-visualization
Richard
la source
la source
0s
la limite inférieure naturelle est et que vous la montrez, alors pourquoi pas?Réponses:
Il y a un peu d'art à équilibrer les aspects esthétiques et informatifs d'un graphique. D'éminents consultants / auteurs en visualisation comme Edward Tufte et Stephen Few choisissent une esthétique minimale qui évite la distraction des parties informatives du graphique. Cependant, pour certains publics, un petit épanouissement est justifié - voir l'application journalistique d'Alberto Cairo de la visualisation de données, par exemple.
L'angle de recherche perceptuel est que chaque élément graphique communique un message, dont certains dont nous ne sommes pas conscients parce que notre cortex visuel le traite (" traitement pré-attentif "). Des éléments supplémentaires, même redondants, peuvent entraîner un traitement supplémentaire. Le graphique approprié dépend du message à communiquer et du public.
Pour votre question spécifique, une ligne connectée met l'accent sur une tendance (et la variation d'une tendance). La zone remplie souligne l'écart par rapport à la ligne de base. Un graphique à barres ou un graphique à aiguilles mettrait l'accent sur des événements discrets s'écartant d'une ligne de base.
Le contexte du graphique est également important. Si vous avez une grille de graphiques serrés, le remplissage aidera à associer chaque ligne à sa ligne de base.
Enfin, une autre considération pour l'ajout d'éléments graphiques / redondants redondants est qu'il est plus difficile d'étendre le graphique avec des éléments plus informatifs. Par exemple, vous pouvez mettre en évidence des valeurs spéciales, superposer d'autres lignes de tendance ou bandes de superposition, comme dans la maquette suivante.
la source
Quelques points supplémentaires à considérer:
Comme mentionné dans un commentaire, un sous-remplissage est largement inapproprié si l'axe x n'est pas à un point zéro naturel y. Cela peut être dû au fait que l'axe des y est mis à l'échelle pour commencer à un nombre différent de zéro, ou parce que les unités utilisées n'ont pas d'interprétation du zéro naturel (par exemple Kelvin a un zéro naturel, tandis que Celsius n'en a pas.)
Deuxièmement, un cas où un sous-remplissage est particulièrement valable est celui où les données elles-mêmes pourraient être considérées comme sous-remplies. Par exemple, un graphique en courbes de la hauteur d'une montagne a un sens d'être sous-rempli, la couleur de remplissage représente la terre, tandis que non remplie représente l'air.
Un exemple connexe pourrait être les données de comptage. Si nous empilions tous les individus à chaque point x, nous obtiendrions un graphique à barres. Si l'interpolation entre les barres est logique, nous nous retrouverions avec un graphique linéaire avec un sous-remplissage.
Cette image de «l'affichage visuel des informations quantitatives» pourrait l'expliquer un peu mieux. Il montre quelles unités militaires étaient en Europe pendant la seconde guerre (je pense). Empiler les unités à chaque instant vous donne un graphique à barres sous-rempli. Tracer une ligne au-dessus des données vous donne un graphique en courbes sous-rempli.
la source
Les deux réponses précédentes couvrent les principaux points importants, mais il y a quelques points qui doivent encore être mentionnés.
Tout d'abord, je dois dire que je ne suis pas d'accord avec l'approche minimaliste extrême de la représentation graphique - que toute encre redondante doit disparaître. Une variation distrayante et non significative devrait disparaître. Mais une zone solide par rapport à une seule ligne peut mieux attirer l'attention et communiquer plus en un coup d'œil. Et comme vous le dites, cela peut ajouter une "variété visuelle".
Cependant, comme le souligne @xan, ce coup d'œil rapide interprète également une zone différemment d'une ligne, de manière partiellement subconsciente.
Un graphique en aires implique une quantité totale qui s'accumule à mesure que vous avancez le long de l'axe des x. Si vous comparez deux graphiques et que l'un a une plus grande zone remplie, votre coup d'œil vous indiquera qu'il a un total plus important quelles que soient les valeurs de début et de fin.
En revanche, un graphique linéaire montre une valeur changeante. L'accent est mis sur le changement de position d'un point à l'autre, et non sur le total accumulé.
Alors, quand devriez- vous utiliser un graphique en aires?
L'idée est que, lors de la lecture du graphique, si vous prenez deux points sur l'axe des x, la zone représentée entre eux devrait représenter une quantité réelle de quelque chose qui s'accumule dans cette plage. Pour cette raison, si vous incluez des valeurs négatives, je vous recommande d'utiliser des couleurs opposées pour les zones négatives et positives pour souligner qu'elles s'annulent dans le total.
Quand ne devriez-vous pas utiliser un graphique en aires?
Avec ces directives à l'esprit, votre graphique ping peut être interprété de deux manières.
D'une part, si vous considérez la vitesse de ping comme une variable unique qui change au cours de la journée, un simple graphique linéaire serait le plus approprié.
D'un autre côté, si vous comparez les modèles de vitesse de ping quotidiens de deux réseaux différents (ou le même réseau à différents jours / périodes de temps), alors vous voudrez peut-être souligner le temps total requis pour les tâches réseau. Par exemple, si votre graphique avait plusieurs pics, au lieu d'un seul, un graphique linéaire mettrait l'accent sur la variabilité de la vitesse tandis qu'un graphique surfacique mettrait l'accent sur le retard total.
Comparer:
le total cumulé est légèrement plus élevé dans la première moitié du graphique (à gauche de la ligne rouge) que dans le second, même si les pics atteignent des valeurs maximales plus élevées à droite. Le remplissage souligne ce bloc solide sur la gauche, de sorte qu'il s'équilibre mieux avec les pics.
(Pardonnez la mauvaise qualité de l'image - je n'ai pas pu trouver comment faire pour que R fasse un graphique en aires! J'ai dû exporter et éditer séparément.)
la source