Lorsque vous tracez un boxplot avec python matplotblib, les lignes à mi-chemin du tracé sont la médiane de la distribution.
Y a-t-il une possibilité d'avoir la ligne à la moyenne. Ou pour le tracer à côté de lui dans un style différent.
De plus, comme il est courant que la ligne soit la médiane, cela va-t-il vraiment dérouter mes lecteurs si je fais la moyenne (bien sûr, j'ajouterai une note sur la ligne médiane)?
data-visualization
python
matplotlib
boxplot
Peter Smit
la source
la source
Pour répondre à votre deuxième question: Oui, je pense qu'il sera déroutant de mettre la ligne à la moyenne au lieu de la médiane. Les règles précises contrôlant la longueur des «moustaches» (le cas échéant) et le traitement des valeurs aberrantes varient, mais tout le monde s'en tient à l'utilisation de la boîte par Tukey comme affichage de la médiane et des quartiles inférieur et supérieur. Pour les distributions fortement asymétriques, la moyenne pourrait être hors des sentiers battus, ce qui serait très étrange. L'usage courant est que la médiane va avec la plage interquartile, tandis que la moyenne va avec l'écart-type (ou l'erreur standard de la moyenne si vous êtes intéressé par l'inférence plutôt que la description des données). Si vous souhaitez afficher visuellement la moyenne, j'utiliserais un symbole différent pour l'afficher afin d'éviter toute confusion.
la source