Vous vous demandez ce que signifie ce graphique d'analyse de tracé de haricot

11

Comment interpréter et générer des graphiques de tracé de haricot Voici un exemple tiré de Walkes et al. 2010 . Pour quel type de données est-il le plus utile?

parcelle de haricot
(source: biomedcentral.com )

Vanson Samuel
la source
3
"Un beanplot est une alternative au boxplot pour la comparaison visuelle des données univariées entre les groupes. Dans un beanplot, les observations individuelles sont montrées comme de petites lignes dans un nuage de points unidimensionnel. À côté de cela, la densité estimée des distributions est visible et la moyenne est affichée. " Extrait tiré d' ici .
Pour ceux qui ne connaissent pas: il s'agit d'un proche parent de l'intrigue de violon (vioplot).

Réponses:

12

Les boîtes à moustaches étaient vraiment conçues pour des données normales, ou du moins des données unimodales. Le Beanplot vous montre la courbe de densité réelle, ce qui est plus informatif.

La forme est la densité et les courtes lignes horizontales représentent chaque point de données. Ceci combine le meilleur d'un boxplot, d'un plot de densité et d'un plot de tapis tout en un et est très lisible.

Malheureusement, l'exemple que vous avez choisi a décidé d'ajouter un tas de lignes plus longues qui encombrent le graphique au-delà de la reconnaissance (pour moi). [couper]

EDIT: Ayant maintenant travaillé avec beanplot un peu plus, les lignes épaisses plus longues sont la moyenne (ou éventuellement la médiane) pour chaque bean. Les lignes fines plus longues sont les données, avec une sorte de "superposition" où les lignes plus larges indiquent plus de valeurs en double. (Vous pouvez également les agiter, ce que je préfère, mais au moins la catégorie "normale" a déjà une bonne densité de points que l'agitation pourrait aggraver.)

Je pense toujours que l'exemple que vous avez choisi est plutôt encombré, ce qui pourrait peut-être être clarifié en utilisant le tremblement au lieu de l'empiler.

Le papier qui décrit le paquet R pour faire des tracés de haricots est une bonne lecture.

Wayne
la source
3
+1 - lecture de l'article sur le graphique du haricot maintenant. Je suggère également un document de travail de Hadley Wickham, 40 ans de boîtes à moustaches . Il passe par une description d'une variété de parcelles avec plus ou moins les mêmes objectifs que les parcelles de haricots.
Andy W
1

Sans avoir lu l'intégralité du papier, il semble être essentiellement une variante du boxplot. En tant que tel, vous pouvez l'utiliser là où vous auriez autrement utilisé un boxplot, comme comparer les distributions univariées de plusieurs groupes. Il affiche une ligne pour chaque point et superpose une estimation de la densité du noyau. En le regardant, je pense qu'il pourrait être plus informatif avec de petites quantités de données, mais être trop encombré avec plus de données. Cela ne me semble pas très secouant la Terre, à première vue. Si vous voulez en savoir plus, élaborez votre question.

gung - Réintégrer Monica
la source