On me demande d'écrire une introduction aux statistiques et je n'arrive pas à montrer graphiquement la relation entre la valeur p et la puissance. Je suis venu avec ce graphique:
Ma question: existe-t-il une meilleure façon d'afficher cela?
Voici mon code R
x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)
plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5),
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4),
labels = expression("p-value", 0, -infinity ))
shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)
# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)
# The alternative hypothesis area
## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"
i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)
## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)
# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)
axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)),
col=col2, lwd=1, lwd.tick=FALSE)
legend("topright", inset=.05, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)
abline(v=ub, lwd=2, col="#000088", lty="dashed")
arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")
Mise à jour
Merci pour les réponses formidables. J'ai changé une partie du code:
# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)
...
legend("topright", inset=.015, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2),
angle=-45,
density=c(20, 1000, 1000), horiz=FALSE)
J'aime l'image en pointillés et légèrement vague de l'hypothèse nulle, car elle signale qu'elle n'est pas vraiment là. J'ai pensé à la transparence et à l'ajout de l'alfa, mais je crains d'avoir trop d'informations dans une image et j'ai donc choisi de ne pas le faire.
Les limites des articles imprimés ne me permettent pas de laisser les lecteurs expérimenter. J'ai choisi la réponse de @Greg Snow avec TeachingDemos comme réponse car j'adore l'idée avec les deux erreurs qui ne se chevauchent pas.
Réponses:
J'ai joué avec des tracés similaires et j'ai constaté que cela fonctionne mieux lorsque les 2 courbes ne se bloquent pas, mais sont plutôt décalées verticalement (mais toujours sur le même axe x). Cela montre clairement que l'une des courbes représente l'hypothèse nulle et l'autre représente une valeur donnée pour la moyenne sous l'hypothèse alternative. La
power.examp
fonction du package TeachingDemos pour R créera ces tracés et larun.power.examp
fonction (même package) vous permet de modifier interactivement les arguments et de mettre à jour le tracé.la source
TeachingDemos
paquet mais j'étais trop paresseux pour le rechercher.)Quelques réflexions: (a) Utiliser la transparence, et (b) Permettre une certaine interactivité.
Voici mon point de vue, largement inspiré d'une applet Java sur les erreurs de type I et de type II - Faire des erreurs dans le système de justice . Comme il s'agit d'un code de dessin plutôt pur, je l'ai collé sous le n ° 1139310 .
Voici à quoi ça ressemble:
la source
aplpack
package contient également de bons modules complémentaires pour les données. Cependant, le rpanel , qui repose également sur tcl / tk, est probablement une meilleure option pour les choses plus complexes. Maintenant, avec RStudio et le package de manipulation , il est également facile d'améliorer l'intrigue de base dans R.G Power 3 , logiciel gratuit disponible sur Mac et Windows, possède de très belles fonctionnalités graphiques pour l'analyse de puissance. Le graphique principal est globalement cohérent avec votre graphique et celui montré par @chl. Il utilise une ligne droite simple pour indiquer l'hypothèse nulle et les distributions statistiques de test d'hypothèse alternative, et les couleurs en bêta et alpha en couleurs distinctes.
Une caractéristique intéressante de G Power 3 est qu'il prend en charge un grand nombre de scénarios courants d'analyse de puissance et l'interface graphique le rend simple à explorer pour les étudiants et les chercheurs appliqués.
Voici une capture d'écran d'une diapositive (tirée d'une présentation que j'ai donnée sur les statistiques descriptives avec une section sur l'analyse de puissance ) avec plusieurs de ces graphiques montrés à gauche. Si vous choisissez une version t-test unilatérale, elle ressemblera davantage à votre exemple.
Il est également possible de produire des graphiques qui montrent la relation fonctionnelle entre les facteurs pertinents pour la puissance statistique et les tests d'hypothèse (par exemple, alpha, taille d'effet, taille d'échantillon, puissance, etc.). Je vous présente quelques exemples de ces graphiques ici . Voici un exemple d'un tel graphique:
la source