Interprétation des parcelles de violon

9

Je compare la distribution de différents groupes à l'aide des parcelles de violon, mais la plupart des ressources en ligne que j'ai trouvées sont uniquement liées à la façon de créer les parcelles et à l'interprétation très basique des résultats (la variation médiane, les données sont regroupées ou non).

Je cherche des exemples détaillés que je peux suivre comme guide pour interpréter correctement les complots de violon.

Gago-Silva
la source

Réponses:

9

Un tracé de violon n'est qu'un histogramme (ou plus souvent une variante lissée comme une densité de noyau) tourné sur le côté et reflété. Tout manuel qui vous apprend à interpréter les histogrammes devrait vous donner l'intuition que vous recherchez. Modifier selon la suggestion de Nick Cox: Freedman, Pisani, Purves, Statistics couvre les histogrammes.

En ce qui concerne leur interprétation d'une manière plus formelle, le but de la représentation graphique de la distribution est de voir des choses par lesquelles les tests statistiques pourraient être trompés.

Une chose que j'aime faire avec les tracés de violon est d'ajouter des lignes pour la médiane, la moyenne, etc. Parfois, je superpose un boxplot pour que je puisse voir encore plus de statistiques récapitulatives.

À tout le moins, vous devriez être en mesure de détecter tout écart brut dans les premiers instants (moyenne, dispersion, asymétrie, kurtosis) ainsi que la bimodalité et les valeurs aberrantes.

Ari B. Friedman
la source
2
+1, un graphique similaire est une pyramide des âges , la distribution reflétée est juste une catégorie différente (et elle utilise des estimateurs de type histogramme plus typiques au lieu de kde).
Andy W du
1
Ni Tukey, Exploratory data analysis , ni Cleveland, Elements of graphing data , en disent long sur les histogrammes: les deux sont plus intéressés et plus impressionnés par les autres représentations. Est-ce que ce sont les livres auxquels on fait allusion ici? Un livre qui couvre les histogrammes comme base est Freedman, Pisani, Purves, Statistics .
Nick Cox
1
En fait, Cleveland ne dit quelque chose histogrammes. Il dit que ce sont de mauvais graphiques et qu'ils ne seront pas utilisés dans son livre. :-). Et F, P et P est un merveilleux livre.
Peter Flom
1
t=ch
1
@TrevorAlexander C'est une bonne question. Je ne suis au courant d'aucune littérature montrant que l'interprétation est meilleure lorsqu'elle est reflétée, mais ils sont plus beaux que les histogrammes dans une orientation verticale, du moins à mes yeux.
Ari B. Friedman