Comment afficher graphiquement l'erreur, la puissance et la taille de l'échantillon de type II (bêta)?

16

On me demande d'écrire une introduction aux statistiques et je n'arrive pas à montrer graphiquement la relation entre la valeur p et la puissance. Je suis venu avec ce graphique:

Deux courbes de Gauss interagissant

Ma question: existe-t-il une meilleure façon d'afficher cela?

Voici mon code R

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Mise à jour


Merci pour les réponses formidables. J'ai changé une partie du code:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

J'aime l'image en pointillés et légèrement vague de l'hypothèse nulle, car elle signale qu'elle n'est pas vraiment là. J'ai pensé à la transparence et à l'ajout de l'alfa, mais je crains d'avoir trop d'informations dans une image et j'ai donc choisi de ne pas le faire.

entrez la description de l'image ici

Les limites des articles imprimés ne me permettent pas de laisser les lecteurs expérimenter. J'ai choisi la réponse de @Greg Snow avec TeachingDemos comme réponse car j'adore l'idée avec les deux erreurs qui ne se chevauchent pas.

Max Gordon
la source
4
Vous pouvez légèrement améliorer votre graphique en utilisant la pseudo-transparence. Quelque chose comme dans cette réponse .
caracal
@caracal (+1) J'aurais dû ajouter un motif fringant (comme vous) pour la zone montrant la puissance.
chl
C'est bien, j'ai vu des parcelles similaires ailleurs. Mais cela ne montre pas les valeurs réelles de plusieurs valeurs p et la puissance à ces valeurs p. Vous pouvez calculer la puissance pour différentes valeurs de p et tailles d'échantillon, puis mettre plusieurs lignes sur un graphique
Peter Flom - Réinstaurer Monica
1
Peut-être que vérifier comment les types de tracés générés par le logiciel G * Power 3 serait bon pour avoir des idées sur ce qu'il faut tracer. Bien que de mémoire, ils semblent très similaires à ce que chl et caracal ont déjà présenté (et ne vous aideraient pas à faire cela dans R).
Andy W
@Andy G * Les graphiques puissance-effet inspirés par rapport à la puissance ou les graphiques puissance-alpha seraient un bel ajout. Pour le premier cas, un début pourrait être cette réponse , qui devrait être facilement adaptable au 2ème cas.
caracal

Réponses:

9

J'ai joué avec des tracés similaires et j'ai constaté que cela fonctionne mieux lorsque les 2 courbes ne se bloquent pas, mais sont plutôt décalées verticalement (mais toujours sur le même axe x). Cela montre clairement que l'une des courbes représente l'hypothèse nulle et l'autre représente une valeur donnée pour la moyenne sous l'hypothèse alternative. La power.exampfonction du package TeachingDemos pour R créera ces tracés et la run.power.exampfonction (même package) vous permet de modifier interactivement les arguments et de mettre à jour le tracé.

Greg Snow
la source
+1, une illustration plus complète que la mienne. (En fait, je savais qu'il y avait quelque chose dans le TeachingDemospaquet mais j'étais trop paresseux pour le rechercher.)
chl
14

Quelques réflexions: (a) Utiliser la transparence, et (b) Permettre une certaine interactivité.

Voici mon point de vue, largement inspiré d'une applet Java sur les erreurs de type I et de type II - Faire des erreurs dans le système de justice . Comme il s'agit d'un code de dessin plutôt pur, je l'ai collé sous le n ° 1139310 .

Voici à quoi ça ressemble:

entrez la description de l'image ici

H0

chl
la source
C'est vraiment génial, je n'avais jamais vu de paquet avant.
Ken Williams
1
@Ken Merci. Le aplpackpackage contient également de bons modules complémentaires pour les données. Cependant, le rpanel , qui repose également sur tcl / tk, est probablement une meilleure option pour les choses plus complexes. Maintenant, avec RStudio et le package de manipulation , il est également facile d'améliorer l'intrigue de base dans R.
chl
8

G Power 3 , logiciel gratuit disponible sur Mac et Windows, possède de très belles fonctionnalités graphiques pour l'analyse de puissance. Le graphique principal est globalement cohérent avec votre graphique et celui montré par @chl. Il utilise une ligne droite simple pour indiquer l'hypothèse nulle et les distributions statistiques de test d'hypothèse alternative, et les couleurs en bêta et alpha en couleurs distinctes.

Une caractéristique intéressante de G Power 3 est qu'il prend en charge un grand nombre de scénarios courants d'analyse de puissance et l'interface graphique le rend simple à explorer pour les étudiants et les chercheurs appliqués.

Voici une capture d'écran d'une diapositive (tirée d'une présentation que j'ai donnée sur les statistiques descriptives avec une section sur l'analyse de puissance ) avec plusieurs de ces graphiques montrés à gauche. Si vous choisissez une version t-test unilatérale, elle ressemblera davantage à votre exemple.

g puissance 3 graphiques

Il est également possible de produire des graphiques qui montrent la relation fonctionnelle entre les facteurs pertinents pour la puissance statistique et les tests d'hypothèse (par exemple, alpha, taille d'effet, taille d'échantillon, puissance, etc.). Je vous présente quelques exemples de ces graphiques ici . Voici un exemple d'un tel graphique:

entrez la description de l'image ici

Jeromy Anglim
la source
Paquet intéressant, je vais l'examiner à l'avenir. Les graphiques semblent cependant un peu compliqués pour quelqu'un de nouveau dans le domaine. Mon public est un MD sans aucune connaissance mathématique ou statistique. Merci!
Max Gordon