Comment interpréter une boîte à moustaches?

8

J'ai quelques données dans lesquelles il y a 5 variables explicatives catégoriques ( concern, breath, weath, sleep, act) et 1 variable de réponse continue ( tto). De plus, chaque variable explicative catégorielle est divisée en 5 niveaux qui montrent à quel point une personne en est convaincue. les niveaux 1 et 5 montrent respectivement les états parfait et pire.

On m'a conseillé de créer une boîte à moustaches pour voir la relation entre les variables explicatives et la variable de réponse. L'intrigue est donnée ci-dessous. Cependant, je ne sais pas lire une boîte à moustaches. Quelqu'un peut-il m'aider à l'interpréter?

entrez la description de l'image ici

Günal
la source
2
Vous avez probablement lu l'article Wikipédia: en.wikipedia.org/wiki/Boxplot Pourriez-vous expliquer plus clairement ce que vous ne comprenez pas?
Stephan Kolassa
Oui j'ai. Je connais donc le personnel de base. Cependant, je ne sais pas comment les utiliser à ce sujet. Je veux dire qu'il y a beaucoup de parcelles ici et je dois choisir les chiffres importants. Par exemple, dans chaque catégorie ci-dessus, les parcelles de niveau 5 sont les plus longues. Qu'est-ce que ça veut dire? Quel effet cela a-t-il sur tto? Un autre exemple serait que pourquoi y a-t-il beaucoup de points? Je sais qu'ils représentent les valeurs aberrantes, mais je ne sais pas comment développer cela
Günal
2
Une question connexe qui couvre les limites de ce que vous pouvez interpréter à partir d'une boîte à moustaches: deux distributions avec des résumés identiques à 5 chiffres auront-elles toujours la même forme?
Silverfish

Réponses:

10

L'interprétation de la boîte à moustaches (alternativement boîte et moustaches) repose sur la compréhension qu'elle fournit une représentation graphique d'un résumé à cinq chiffres, c'est-à-dire minimum, 1er quartile, médiane, 3e quartile et maximum. L'encadré contient 50% des observations. Les extrémités des moustaches (lignes verticales émanant du haut et du bas de la boîte) indiquent généralement où se trouvent le minimum et le maximum. Cependant, lorsque des valeurs aberrantes possibles existent (parfois évaluées sur la base d'une plage interquartile de 1,5 ), des points sont ajoutés, comme c'est le cas pour votre figure.×

Il peut être utile pour vous de consulter un histogramme ou des graphiques de densité sur des catégories spécifiques de données, car cela peut vous aider à comprendre ce que le graphique en boîte dit.

@Glen_b indique à juste titre que l'inclinaison gauche est évidente et que la tendance centrale pour le 5ème niveau de force de sensation est plus faible que les autres. Il est cependant difficile de voir si cette différence serait statistiquement significative ou non.

t-étudiant
la source
8

Voici un résumé de base de ce qui s'y trouve:

  1. Toutes les distributions semblent asymétriques vers la gauche, "coincées" contre la limite supérieure de 1,0, avec de nombreuses «valeurs aberrantes» basses se dirigeant vers le bas.
  2. La 5e catégorie de chaque intrigue semble se situer plus bas que les autres. Parfois, la 4e catégorie est également faible.
  3. Les 5 variables (préoccupation, souffle, respiration, sommeil, acte) semblent avoir des schémas globalement similaires.
Glen_b -Reinstate Monica
la source