Comment visualiser un test t indépendant à deux échantillons?

11

Quels sont les moyens les plus acceptés pour visualiser les résultats d'un test t indépendant à deux échantillons? Est-ce qu'un tableau numérique est plus souvent utilisé ou une sorte de graphique? L'objectif est pour un observateur occasionnel de regarder la figure et de voir immédiatement qu'ils proviennent probablement de deux populations différentes.

cbake
la source
"Accepté" par qui, dans quel contexte? "Plus souvent utilisé" où?
Glen_b -Reinstate Monica

Réponses:

18

Il vaut la peine d'être clair sur le but de votre intrigue. En général, il existe deux types d'objectifs différents: vous pouvez créer des graphiques pour évaluer les hypothèses que vous faites et guider le processus d'analyse des données, ou vous pouvez créer des graphiques pour communiquer un résultat aux autres. Ce ne sont pas les mêmes; par exemple, de nombreux téléspectateurs / lecteurs de votre intrigue / analyse peuvent être statistiquement non sophistiqués et ne pas être familiers avec l'idée, par exemple, de la variance égale et de son rôle dans un test t. Vous voulez que votre intrigue transmette les informations importantes sur vos données, même à des consommateurs comme eux. Ils font implicitement confiance que vous avez fait les choses correctement. D'après votre configuration de questions, je suppose que vous recherchez ce dernier type.

De manière réaliste, l'intrigue la plus courante et la plus acceptée pour communiquer les résultats d'un test t 1 à d'autres (mis à part s'il est réellement le plus approprié) est un diagramme à barres des moyennes avec des barres d'erreur standard. Cela correspond très bien au test t dans la mesure où un test t compare deux moyennes en utilisant leurs erreurs standard. Lorsque vous avez deux groupes indépendants, cela donnera une image intuitive, même pour les personnes statistiquement peu sophistiquées, et (si les données le permettent), les gens peuvent "immédiatement voir qu'ils sont probablement de deux populations différentes". Voici un exemple simple utilisant les données de @ Tim:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

entrez la description de l'image ici

Cela dit, les spécialistes de la visualisation des données dédaignent généralement ces graphiques. Ils sont souvent ridiculisés comme des "parcelles de dynamite" (cf. Pourquoi les parcelles de dynamite sont mauvaises ). En particulier, si vous ne disposez que de quelques données, il est souvent recommandé de simplement afficher les données elles-mêmes . Si les points se chevauchent, vous pouvez les faire trembler horizontalement (ajouter une petite quantité de bruit aléatoire) afin qu'ils ne se chevauchent plus. Parce qu'un test t concerne fondamentalement les moyennes et les erreurs standard, il est préférable de superposer les moyennes et les erreurs standard sur un tel tracé. Voici une version différente:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

entrez la description de l'image ici

Si vous avez beaucoup de données, les boîtes à moustaches peuvent être un meilleur choix pour obtenir un aperçu rapide des distributions, et vous pouvez également y superposer les moyens et les SE.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

entrez la description de l'image ici

Les diagrammes simples des données et les diagrammes en boîte sont suffisamment simples pour que la plupart des gens puissent les comprendre même s'ils ne sont pas très avertis sur le plan statistique. Gardez à l'esprit, cependant, qu'aucun de ces éléments ne permet d'évaluer facilement la validité d'avoir utilisé un test t pour comparer vos groupes. Ces objectifs sont mieux servis par différents types de parcelles.

1. Notez que cette discussion suppose un test t d'échantillons indépendants. Ces graphiques pourraient être utilisés avec un test t d'échantillons dépendants, mais pourraient également être trompeurs dans ce contexte (cf., Est-ce que l'utilisation de barres d'erreur pour les moyennes dans une étude intra-sujets est mauvaise? ).

gung - Réintégrer Monica
la source
Un gros problème avec l'utilisation du graphique barre + CI est que parfois la différence est statistiquement significative, mais les IC se chevauchent . Étant donné que l'intrigue bar + CI tente de plaire à un public généraliste, nous ne voulons vraiment pas passer du temps à expliquer cette ride supplémentaire.
Heisenberg
@ Heisenberg, j'en suis conscient. Il n'y a pas d'intrigue unique et parfaite pour toutes les occasions et à toutes fins. Je n'ai pas non plus mentionné les CI, seulement les SE (bien que ce soit équivalent à certains CI, selon le df). La signification est communément mentionnée dans la légende de la figure et discutée dans le texte. Si vous souhaitez qu'il s'affiche sans ambiguïté dans le tracé lui-même, vous pouvez ajouter des crochets et des valeurs de p (par exemple, ici ).
gung - Rétablir Monica
Mes excuses si le ton semble agressif. Je suis juste un peu vexé qu'à la fin il n'y ait toujours pas de manière élégante de visualiser un test t à un public généraliste sans expliquer davantage. Cela peut se résumer au traçage: 2 graphiques à barres montrant les moyennes de groupe avec SE et un troisième graphique montrant la différence et son IC (comme votre lien ). Mais une telle visualisation montre des informations redondantes (groupes moyens ET différence de moyens), ce qui pourrait également dérouter le public.
Heisenberg
@ Heisenberg, je n'utiliserais pas l'intrigue de mon autre réponse à moins que j'essaie d'afficher un test t intra-patients. Je pense qu'il est probablement souvent bien de présenter 2 barres avec SE pour un test t, avec une légende simple. Si vous avez besoin de signification dans l'intrigue, vous pouvez ajouter des crochets ou quelque chose comme ça (je le trouve généralement inutile).
gung - Réintègre Monica
14

Le moyen le plus couramment utilisé pour visualiser -test comme comparaison est d'utiliser boxplots . Ci-dessous, je donne un exemple utilisant un ensemble de données décrivant "la relation entre le tabagisme de la marijuana et un déficit de performance sur une tâche mesurant la mémoire à court terme" de ce site .t

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

entrez la description de l'image ici

En fait, les boîtes à moustaches sont couramment utilisées pour les tests d'hypothèses «informelles», par exemple comme décrit par Yoav Benjamini dans l'article de 1988 Ouvrir la boîte d'une boîte à moustaches :

Le boxplot régulier est complété par un intervalle de confiance approximatif pour la médiane du lot, représenté par une paire de coins retirés des côtés de la boîte. Ces intervalles de confiance sont construits de telle manière que lorsque deux encoches de boîtes à moustaches différentes ne se chevauchent pas, leurs médianes sont significativement différentes. (...) La formule de l'intervalle de confiance étant un temps constant de l'intervalle interquartile divisé par la racine carrée de la taille du lot, cette dernière peut être perçue à partir de la longueur des coins par rapport à la longueur de la boîte.

Voir aussi: T-test utilisant uniquement des données récapitulatives dans une boîte à moustaches

Ce graphique ne montre pas les quantités directement impliquées dans le test , comme l' a remarqué @NickCox . Si vous souhaitez une comparaison directe des moyennes avec des intervalles de confiance, vous pouvez utiliser un graphique à barres avec des intervalles de confiance marqués. L'utilisation de moyennes et d'intervalles de confiance vous permet également de réaliser des tests d'hypothèses (voir ici ou ici ).t

entrez la description de l'image ici

Comme vous pouvez le voir dans d'autres articles et commentaires sous ce fil, les boîtes à moustaches et les parcelles à dynamite sont un choix quelque peu controversé, alors laissez-moi vous donner une autre alternative qui n'a pas encore été mentionnée. Tout d'abord, rappelons que test et régression sont liés . Vous pouvez tracer -test comme comparaison que deux points avec errorbars (intervalles de confiance) qui sont connectés à la ligne. La pente de la ligne est proportionnelle à la pente de régression si vous avez utilisé la régression linéaire plutôt quet tttt-tester dans cette situation. Le principal avantage d'un tel tracé est qu'il vous permet de juger facilement de l'amplitude de la différence de moyennes en regardant la pente de la ligne. Son inconvénient peut être qu'il peut suggérer qu'il existe une certaine «continuité» entre les moyens (c'est-à-dire que vous aviez des échantillons appariés).

entrez la description de l'image ici

Les boîtes à moustaches semblent être plus couramment utilisées, car elles fournissent plus d'informations sur la distribution des variables visualisées (en comparant la moyenne avec l'intervalle de confiance uniquement). Ils complètent également plutôt que reproduisent les informations du test et une telle utilisation de l'intrigue est encouragée par la plupart des guides de style, par exemple par le manuel de publication de l'American Psychological Association :t

La première considération est la valeur informative de la figure dans le texte du papier dans lequel elle doit apparaître. Si le chiffre n'ajoute pas de façon substantielle à la compréhension du document ou reproduit d'autres éléments du document, il ne doit pas être inclus.

Tim
la source
4
C'est en effet courant, même dans les textes qui traitent des tests t et de l'ANOVA, mais c'est néanmoins un choix extraordinaire. Le diagramme en boîte ne montre pas directement les quantités impliquées dans un test t. Au minimum, un diagramme pertinent devrait montrer les moyennes et donner plus de détails sur la distribution qu'un diagramme en boîte. Le détail dans les queues est souvent crucial pour interpréter le test.
Nick Cox
OK @NickCox, l'ensemble de données a été choisi juste pour la visualisation, mais maintenant je l'ai changé pour un exemple plus approprié.
Tim
3
Le tracé à barres (ou "tracé de dynamite") a un rapport encre / information extrêmement élevé.
Frank Harrell
La citation du manuel de l'APA (je n'ai pas vérifié le contexte) est un bon conseil général, mais n'est pas en soi un argument direct pour utiliser le diagramme en boîte partiellement pertinent dans ce contexte. Je conviens, naturellement, que les boîtes à moustaches peuvent être très utiles et souvent complémentaires, et qu'elles sont très souvent utilisées, mais mon premier point demeure.
Nick Cox
@NickCox Je ne peux pas dire que je suis d'accord avec vous, mais je considérerais quand même boxplot pour fournir des informations supplémentaires et ne pas reproduire les résultats du test t même si cela ne concerne pas directement le test t. C'est simple, clair et informatif.
Tim
8

Il s'agit principalement d'une variation des réponses utiles de @Tim et @gung, mais les graphiques ne peuvent pas être intégrés dans un commentaire.

Petits points mais éventuellement utiles:

  1. Un tracé en bandes ou en points tel qu'illustré par @gung doit être modifié s'il y a des liens, comme il en existe dans les données d'exemple. Les points peuvent être empilés ou trémoussés, ou comme dans l'exemple ci-dessous, vous pouvez utiliser un diagramme hybride à boîte quantile comme suggéré par Emanuel Parzen (la référence la plus accessible est probablement 1979. Modélisation de données statistiques non paramétriques. Journal, American Statistical Association74: 105-121). Cela a également d'autres avantages, en soulignant que si la moitié des données se trouvent à l'intérieur de la boîte, alors la moitié est également à l'extérieur, et en montrant essentiellement tous les détails de la distribution. Lorsqu'il n'y a que deux groupes, comme c'est le cas dans ce contexte, n'importe quel type plus classique de boîte à moustaches peut être un affichage minimal, voire squelettique. Certains considéreraient cela comme une vertu, mais il est possible de montrer plus de détails. L'argument inverse est qu'une boîte à moustaches signalant des points particuliers, notamment ceux à plus de 1,5 IQR du quartile le plus proche, est un avertissement clair pour l'utilisateur: faites attention avec un test t, car il peut y avoir des points dans les queues que vous devriez inquiétez-vous.

  2. Vous pouvez naturellement ajouter une indication des moyens à une boîte à moustaches, ce qui est assez souvent fait. L'ajout d'un marqueur ou d'un symbole de point différent est courant. Ici, nous choisissons des lignes de référence.

entrez la description de l'image ici

Parcelles en boîte quantile pour fumeurs et non-fumeurs. Les cases indiquent les médianes et les quartiles. Les lignes horizontales en bleu indiquent les moyennes.

Remarque. Le graphique a été créé dans Stata. Voici le code pour les personnes intéressées. stripplotdoit être installé au préalable avec ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

ÉDITER. Cette idée supplémentaire, en réponse à la réponse de @Frank Harrell, superpose deux tracés de probabilité normale (tracés vraiment quantile-quantile). Les lignes horizontales indiquent les moyennes. Certains voudraient ajouter des lignes pour chaque groupe indiquant un ajustement parfait, par exemple via ( , sa moyenne) et ( , sa moyenne sa SD) ou des alternatives résistantes.1 +01+

entrez la description de l'image ici

Nick Cox
la source
1
+1, je voulais modifier les données, mais je n'ai pas encore pu y accéder. Je pensais également à ajouter des parcelles plus avancées, notamment des parcelles à boîte de quantiles, des parcelles de violon et des parcelles qq, mais j'ai finalement abandonné l'idée de répertorier toujours plus de parcelles.
gung - Rétablir Monica
@gung Assez bien; malheureusement ou heureusement, le fil pourrait facilement se transformer en comment comparer deux distributions en général. Pour d'autres exemples de données, les histogrammes pourraient être un concurrent sérieux, etc.
Nick Cox
5

Outre le beau but de présenter les résultats il devrait y avoir une certaine considération dont graphiques vérifier les hypothèses de la variance égale à deux échantillons -test pour elle d'avoir d' excellentes performances. Ce seraient des fonctions inverses normales des deux fonctions empiriques de distribution cumulative. Pour satisfaire aux hypothèses de test, ces deux courbes doivent être des droites parallèles.t

Frank Harrell
la source
J'ai ajouté une des différentes possibilités à ma propre réponse.
Nick Cox