Quel est le nom de ce tracé utilisant des lignes verticales pour montrer une distribution?

14

Y a-t-il un nom officiel pour ce graphique extrêmement simple, dans lequel les lignes verticales indiquent la distribution de certains échantillons dans une plage?

entrez la description de l'image ici

janvier
la source
8
"tapis", lorsqu'il est utilisé avec d'autres parcelles.
Gimelist
7
Il n'y a pas de nom officiel. Tout dépend si l'utilisation de lignes verticales est essentielle, ou si d'autres symboles sont acceptés, et si l'empilement ou le tremblement est autorisé lorsqu'il y a des liens. À stats.stackexchange.com/questions/102735/… je donne 22 noms différents trouvés pour le sens plus large de ce type d'intrigue.
Nick Cox

Réponses:

24

Le premier exemple dans lequel je les ai référencés est des bandes affichant des distributions empiriques: I. des bandes de points texturées (Tukey et Tukey, 1990) bien que je n'aie jamais pu obtenir ce rapport technique.

Tim a raison: ils sont souvent accompagnés comme tapis sur une parcelle supplémentaire pour montrer l'emplacement des observations individuelles, mais la parcelle de terrain est un peu plus générale et ce type de parcelle n'est pas toujours sur le tapis d'une autre parcelle comme le montre votre question!

  • Voici un exemple d'utilisation de points sur le tapis au lieu de lignes.
  • Voici un exemple du tapis étant des points et ne affichant pas toutes les données, mais uniquement les données manquantes dans l'autre dimension d'un nuage de points.

Ainsi, un tracé de tapis n'est pas toujours un ensemble de lignes aux frontières d'un autre graphique, et ce type de tracé dans votre question n'est pas toujours en marge d'un autre tracé. Voici un exemple de lignes superposées sur une densité de noyau plutôt que sur le tapis de l'intrigue, appelé beanplot . Les lignes plus grandes, je crois, sont utilisées pour visualiser différents quantiles (aka valeurs de lettre) de la distribution.


(source: biomedcentral.com )

Dans la grammaire graphique de Wilkinson, il peut être considéré comme un nuage de points unidimensionnel mais en utilisant des segments de ligne au lieu de la valeur par défaut typique des cercles. Le but est d'empêcher la superposition de nombreux points voisins. Si vous avez de nombreux points et les dessinez de manière semi-transparente, ils se transforment finalement en une bande de densité, voir l'image finale dans ce post .

Je les ai même vus suggérer d'utiliser comme sparklines ( Greenhill et al., 2011 ) dans cet exemple pour visualiser des données binaires. Greenhill les appelle dans cet exemple de tracés de séparation , et voici un exemple tiré du document référencé (p.995):

entrez la description de l'image ici

Donc, dans cet exemple, il y a des valeurs le long de l'axe entier, et la couleur est utilisée pour visualiser une variable binaire. La ligne noire de ce graphique représente la proportion cumulée d'observations rouges.

Andy W
la source
6
+1 Strip plot est également un terme courant.
whuber
1
@whuber: Strip plot, yes, or a strip chart .
amibe dit Réintégrer Monica
1/nnn
C'est une bonne description @NickCox, mais je ne pense pas que les tracés de séparation soient si différents. Dans la grammaire de Wilkinson, il peut être considéré comme un nuage de points unidimensionnel, avec le rang sur la dimension unique, puis en utilisant la couleur pour distinguer les deux types de points. Avec seulement deux types de points, vous n'avez même pas besoin d'avoir les données pour l'un des ensembles, donc le graphique d'origine de l'OP pourrait être un tracé de séparation avec les barres noires affichant une catégorie et l'arrière-plan gris le complément.
Andy W
Ce n'est pas si différent de certains graphiques sparkline que j'ai vus en visualisant les victoires / pertes pour les équipes sportives. (Tous les graphiques doivent être mappés sur un intervalle fini pour projeter les données sur la page / l'écran de l'ordinateur, donc si les données réelles sont limitées à l'intervalle unitaire, je ne pense pas que ce soit important pour décrire le graphique lui-même.) Je n'appellerais pas un nuage de points de données classées un nom différent parce que les points ne sont pas placés "où ils appartiennent".
Andy W
20

Cela s'appelle un tracé de tapis (voir par exemple ici ou ici ). Dans R, cela peut être fait avec une rugfonction.

L'intrigue semble également apparaître sous un autre nom, sous forme de graphique à bandes , il est mentionné comme cela par Phillip I. Good dans Introduction to Statistics through Resampling Methods et R / S-Plus (2005, Wiley). Dans R, il est appelé par stripchartfonction.

Il semble que la version minuscule qui accompagne souvent une parcelle plus grande soit appelée parcelle de terrain, tandis que la parcelle autonome composée de points ou de lignes verticales est appelée diagramme à bandes.

Tim
la source
Merde, j'étais si proche - je cherchais un complot de chiffon (et comme on pouvait s'y attendre , je n'ai rien trouvé). Je vous remercie!
Janvier
2
Je pense que dans la pratique, les gens ne se réfèrent à de tels tracés comme des tracés de tapis que lorsqu'ils sont marginaux par rapport à un autre point tel qu'un histogramme ou un nuage de points.
Nick Cox
3

Dans l'étiquetage commercial des marchandises, code à barres ou

s'il s'agit de lignes de fréquence tracées dans le temps, Spectrum .

EDIT1

Lorsque dans les nuages ​​électromagnétiques ou les chromatographes en phase gazeuse, les forces sont tracées linéairement sur une échelle de fréquence, nous pouvons également dire Spectre.

Narasimham
la source
3
Salut, bienvenue sur le site. Malheureusement, cela ne répond pas à la question car les lignes dans les codes-barres ou les spectres "n'indiquent pas la distribution de certains échantillons dans une plage" comme le spécifie la question.
Juho Kokkala
4
@JuhoKokkala Je suis en désaccord en partie. Les codes-barres utilisés dans l'industrie ne correspondent pas, d'accord, mais le terme tracé de code-barres a été utilisé pour indiquer ce type de tracé pour des données réelles. De même, les données spectroscopiques peuvent également être considérées comme des données. Je ne m'en tiendrai pas au libellé de l'OP car il confond "échantillons" et "valeurs d'échantillons".
Nick Cox
2
Le tapis est le plus proche, je suis d'accord. Mais cela a aussi été appelé un tracé de code à barres. Le tracé de code à barres, cependant, a souvent une épaisseur de ligne, ou une nuance / transparence, pour montrer la densité des valeurs proches. Nous utilisons beaucoup ce type de tracé avec des données ADN pour marquer les emplacements des entités.
Dianne Cook du
0

J'ai le même problème: quel est le nom du "code à barres" comme la visualisation des données vraies / fausses

Mon objectif est de représenter une liste de tableaux vrai / faux correspondant à un tableau de mots à un endroit fixe du tableau. Comme une représentation du "spectre lumineux" pour identifier l'assorbement d'une onde lumineuse spécifique .... dans une même situation je veux encapsuler les mots manquants et les mots présents

Je l'ai trouvé sur Vega the Strip Plot

https://vega.github.io/vega-lite/examples/tick_strip.html

Je pense que mon objectif est un meilleur nom pour représenter mon idée de visualisation

Domenico M.
la source