Comment calculer un intervalle de confiance pour la corrélation de rang de Spearman?

13

Wikipedia a une transformée de Fisher de la corrélation de rang de Spearman à un z-score approximatif. Peut-être que ce z-score est la différence de l'hypothèse nulle (corrélation de rang 0)?

Cette page contient l'exemple suivant:

4, 10, 3, 1, 9, 2, 6, 7, 8, 5
5, 8, 6, 2, 10, 3, 9, 4, 7, 1
rank correlation 0.684848
"95% CI for rho (Fisher's z transformed)= 0.097085 to 0.918443"

Comment utilisent-ils la transformée de Fisher pour obtenir l'intervalle de confiance à 95%?

dfrankow
la source

Réponses:

20

En un mot, un intervalle de confiance à 95% est donné par où est l'estimation de la corrélation et est la taille de l'échantillon.
rn

tanh(arctanhr±1.96/n3),
rn

Explication: La transformation de Fisher est arctanh. Sur l'échelle transformée, la distribution d'échantillonnage de l'estimation est approximativement normale, donc un IC à 95% est trouvé en prenant l'estimation transformée et en ajoutant et en soustrayant 1,96 fois son erreur standard. L'erreur standard est (environ) .1/n3

EDIT : L'exemple ci-dessus en Python:

import math
r = 0.684848
num = 10
stderr = 1.0 / math.sqrt(num - 3)
delta = 1.96 * stderr
lower = math.tanh(math.atanh(r) - delta)
upper = math.tanh(math.atanh(r) + delta)
print "lower %.6f upper %.6f" % (lower, upper)

donne

lower 0.097071 upper 0.918445

qui correspond à votre exemple à 4 décimales.

un arrêt
la source
Une question: comment le 1.06 dans en.wikipedia.org/wiki/… se rapporte-t-il à votre réponse?
dfrankow
Tu m'as là! Je ne sais pas pour être honnête; Je l'ai juste essayé avec et sans et cela correspondait aux exemples de résultats sans lesquels vous avez donné beaucoup mieux.
2011
1
@dfrankow J'ai accepté cette modification, mais ce n'est pas une utilisation parfaite de cette fonctionnalité - la meilleure idée est d'ajouter un tel texte à la question.
6
@dfrankow A propos de la valeur 1.06 : Il semble Wikipédia se réfère à Fieller et al de. papier Biometrika où l'estimation de la variance de la population de ( est l'estimation de la corrélation) est défini comme , mais voir Bonnett et Wright, Exigences de taille d'échantillon pour estimer les corrélations de Pearson, Kendall et Spearman , Psychometrika 65 (1): 23, 2000.& thetav σ 2 ζ1,06/(n-3)ζ^=tanh1θ^θ^σζ^21.06/(n3)
chl