Lire des parcelles en boîte et moustaches: est-il possible de glaner des différences significatives entre les groupes?

11

Supposons que nous examinions ce complot en boîte et moustaches:

terrain

Entre jeudi et vendredi, je pense que la plupart conviendraient qu'il semble y avoir une différence significative dans le temps passé à dormir. Est-ce une conjecture statistiquement valable, cependant? Pouvons-nous discerner des différences significatives du fait qu'aucune des fourchettes du quartile interne ne se chevauche entre jeudi et vendredi? Qu'en est-il du fait que les moustaches supérieures et inférieures de jeudi et vendredi, respectivement, se chevauchent? Cela affecte-t-il notre analyse?

Habituellement, accompagner un tableau comme celui-ci serait une sorte d'ANOVA, mais je suis juste curieux de savoir combien nous pouvons dire sur les différences entre les groupes simplement en regardant un boxplot .

blacksite
la source
Les cercles représentent des valeurs aberrantes.
Michael R. Chernick
3
Tant que l'intrigue ne contient aucune indication de la taille de l'échantillon, c'est difficile. Mais si vous incluez les intervalles de confiance du graphique pour les médianes, vous pouvez comparer ces intervalles de confiance. Ils ne semblent pas être présents dans votre intrigue.
kjetil b halvorsen
@kjetilbhalvorsen c'est juste un complot que je saisis de Google :) ... J'ai inclus, sur mon propre complot, exactement ce que vous avez décrit, dans le cadre d'un test HSD de Tukey
blacksite
2
Sans CI, vous ne pouvez pas parler de différences "significatives". Cependant, je dirais qu'il y a une différence "notable" entre jeudi et vendredi. Ou même la différence "la plus notable" se produit entre jeudi et vendredi ..
Ashe
1
Les cercles sont des points à plus de 1,5 IQR du quartile le plus proche. Ce ne sont pas des valeurs aberrantes sans équivoque et objectivement. Ce jeudi n'est pas extraordinaire par rapport au reste de la distribution. C'est vraiment le cas pour vendredi; et un chercheur ou un analyste devrait vouloir vérifier si possible et voir s'il y a une histoire à expliquer. Peut-être que quelqu'un n'a vraiment pas dormi! Marquer les points de données de cette manière, c'est les signaler pour inspection et réflexion. Ce n'est pas une méthode statistique d'identification des démons à exorciser.
Nick Cox

Réponses:

4

Non, tu ne peux pas. Si vous aviez les tailles d'échantillon et beaucoup d'expérience, vous pourriez deviner - et la précision de votre supposition dépendrait (en plus de la taille de l'effet) de la taille de l'échantillon. Si N = 1 000 000 par groupe, beaucoup d'importance. Si N = 10 par groupe, pas tellement. À 100 par groupe, c'est plus difficile à deviner.

Je dirais que c'est une bonne chose. La chose à faire avec une boîte à moustaches n'est pas d'essayer de deviner la signification statistique mais de regarder ce qui se passe et d'essayer de raisonner à ce sujet. Hmm. Plus de sommeil le week-end. C'est intéressant mais pas vraiment surprenant. Nous pourrions modéliser les heures de sommeil en fonction du week-end ou non. Ou nous pourrions essayer de voir si ce modèle variait. Peut-être que les retraités n'ont pas ce schéma? Et les travailleurs postés? Les gens qui travaillent le week-end? Des gens qui travaillent 7 jours sur 7?

Comme disait mon professeur préféré à l'école doctorale (Herman Friedman): "Arrête de piquer sur la recherche!"

Peter Flom - Réintégrer Monica
la source
1
Je pense que cette réponse est inutilement pessimiste. Les boîtes à moustaches contiennent en fait des informations sur la taille des groupes, car les très petites tailles de groupe ( ) ont des structures "dégénérées" caractéristiques. Parce que ces distributions ne sont pas trop asymétriques et ont peu de valeurs aberrantes, l'IQR (multiplié par un multiple approprié) est un bon substitut pour la SD, d'où nous pouvons dépasser les erreurs standard. Ainsi, on peut faire une ANOVA grossière et prête conservatrice à partir de la seule parcelle: et cela montrera que l'ANOVA globale est significative. On peut également faire des tests post-hoc conservateurs . N<5
whuber
8

Oui, vous pouvez. Au moins dans un sens approximatif.

Je souligne comment ci-dessous (et en effet il y a une relation avec le "chevauchement de boîtes" comme vous le suggérez) avec quelques mises en garde et limitations. Mais d'abord, discutons de quelques préliminaires pour un contexte et un contexte. (Je pense qu'une réponse appropriée ici ne devrait pas se concentrer sur les détails de l'exemple - bien que cela mérite peut-être une mention en aparté - mais sur la question centrale de l'utilisation des boîtes à moustaches pour évaluer si les différences apparentes peuvent facilement être expliquées par une variation aléatoire ou non. .)

Si vous avez accès aux données, vous pouvez dessiner des boîtes à moustaches à encoches conçues pour ce type de comparaison visuelle.

Image montrant des boîtes à moustaches crantées en R

Il y a une discussion sur les calculs de boxplot crantés ici . Si les intervalles d'entaille ne se chevauchent pas, les deux groupes comparés sont approximativement différents au niveau de 5%; les calculs sont basés sur des calculs à la normale, mais ils sont assez robustes et fonctionnent assez bien sur une gamme de distributions. (S'il est traité comme un test formel, la puissance n'est pas si élevée à la normale, mais elle devrait plutôt bien fonctionner pour une variété de cas plus ou moins "typiques" à queue plus lourde.)

Compte tenu du fonctionnement des boîtes à moustaches à encoches, vous pouvez discerner une règle empirique rapide qui fonctionnera lorsque vous n'aurez qu'un affichage comme celui de la question. Lorsque la taille de l'échantillon est de 10 et que la médiane est placée près du milieu de la boîte, les encoches d'une boîte à moustaches à encoches ont environ la largeur de la boîte, de sorte que les extrémités des encoches et la boîte sont à peu près au même endroit.

Voir ici pour une discussion sur la façon dont un "n=10

n=10

n=9n=10

n=10n=10,10n=9,9n=8,8

nnn=40

En regardant votre intrigue:

Notez que l’apparence de la parcelle dans la question permet de constater que la taille des échantillons doit être d’au moins 5; s'ils étaient inférieurs à 5, les boîtes à moustaches à échantillon individuel auraient des indices distincts qu'elles provenaient d'un échantillon de taille inférieure (comme les médianes étant le point mort de chaque boîte, ou le moustache étant de longueur 0 lorsqu'il y avait une valeur aberrante).

Alternativement, si les cases (marquant les quartiles) ne se chevauchent pas et que la taille de l'échantillon est d'au moins 10, les deux groupes comparés devraient avoir des médianes différentes au niveau de 5% (considérées comme une seule comparaison par paire).

nn=5

[Notez que cela ne tient pas compte du nombre de comparaisons, donc si vous effectuez plusieurs comparaisons, votre erreur globale de type I sera plus importante. Il est destiné à une inspection visuelle plutôt qu'à des tests formels; néanmoins, les idées en cause peuvent être adaptées à une approche plus formelle, y compris un ajustement pour des comparaisons multiples.]

Après avoir examiné si vous le pouvez , il serait raisonnable de considérer si vous le devriez . Peut-être pas; le problème du piratage p potentiel est réel, mais si vous l'utilisez pour déterminer si, par exemple, poursuivre la collecte de nouvelles données sur le problème de la recherche et tout ce que vous avez est un boxplot dans un papier - disons - cela peut être assez utile pour pouvoir évaluer s'il y a plus que ce qui pourrait facilement être expliqué par la variation due au bruit. Mais examiner ce problème en profondeur reviendrait vraiment à répondre à une autre question.

Glen_b -Reinstate Monica
la source