Pourquoi ma réplication de Silver & Dunlap 1987 ne fonctionne-t-elle pas?

J'essaie de reproduire Silver & Dunlap (1987) . Je compare simplement la moyenne des corrélations ou la moyenne des corrélations de transformation z et la transformation inverse. Il me semble que je ne reproduis pas l'asymétrie dans le biais qu'ils trouvent (les z transformés en retour ne sont pas plus proches de la valeur de la population que rs). Des pensées? Est-il possible que la puissance de calcul de 1987 n'ait tout simplement pas suffisamment exploré l'espace?

# Fisher's r2z
fr2z <- atanh
# and back
fz2r <- tanh

# a function that generates a matrix of two correlated variables
rcor <- function(n, m1, m2, var1, var2, corr12){
    require(MASS)
    Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2)
    Sigma <- matrix(Sigma, 2, 2)
    return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) )
    }

Avec ces fonctions, il est facile de regarder un tas de corrélations (reproduire essentiellement l'argent et le dunlap 1987) et de voir la différence entre la moyenne des corrélations et la moyenne des scores z et la transformation inverse. En voici un.

r <- 0.9
Y <- replicate(20000, rcor(10, 0, 0, 1, 1, r))
rs <- apply(Y, 3, function(x) cor(x[,1], x[,2]))
mean(rs) - r
zs <- fr2z(rs)
fz2r( mean(zs) ) - r

En regardant simplement la taille de l'échantillon de 10 et les corrélations de 0,1, 0,5 et 0,9, voici les résultats.

     rho  r bias   z bias
     0.1  -0.006   0.006
     0.5  -0.024   0.021
     0.9  -0.011   0.011

Et ceux-ci sont dérivés du tableau 1 de Silver & Dunlap.

     rho  r bias   z bias
     0.1  -0.007   0.003
     0.5  -0.025   0.001
     0.9  -0.011  -0.007

Ce sont des résultats assez différents. D'après mon test, je constate que c'est juste une question de direction de biais, pas d'ampleur. Mais, dans l'article publié, ils trouvent beaucoup moins d'amplitude avec z. Je n'ai pas trouvé de non-réplication publiée.

r correlation data-transformation simulation normalization John
la source

Je suis bloqué sur vos deux premières lignes. Ils ne semblent pas être une syntaxe R correcte. Ils semblent également supposer que atanh est son propre inverse, mais ce n'est pas le cas: tanh est l'inverse de atanh.

whuber

Ce ne sont que des fautes de frappe dans la question ... corrigées.

John

Pour moi, juste à l'œil, le r biasfor rhode 0,5 dans le tableau Silver & Dunlap ressemble à la valeur aberrante pour moi. Je ne peux certainement pas garantir la qualité de la revue, qui semble assez nouvelle et un peu rude sur les bords, mais j'ai trouvé ce document récent avec une recherche Google. Voir, en particulier, leur tableau 3 qui, encore une fois, à l'œil, semble corroborer vos résultats.

Cardinal

@whuber: Tout à fait vrai. Cependant, l'UMVUE de

ρ

$\rho$ dans le cas normal bivarié --- comme vous le savez très bien --- est (assez) bien connu pour être

r \frac{Γ ((n - 2) / 2)}{Γ (1 / 2) Γ ((n - 3) / 2)} \int_{0}^{1} \frac{u^{- 1 / 2} (1 - u)^{(n - 5) / 2}}{\sqrt{1 - u (1 - r^{2})}} d u .

$r \frac{\Gamma((n-2)/2)}{\Gamma(1/2)\Gamma((n-3)/2)}\int_0^1 \frac{u^{-1/2} (1-u)^{(n-5)/2}}{\sqrt{1-u(1-r^2)}} \,\mathrm{d}u \>.$ Ici

r

$r$ est le MLE. Parfois, cet estimateur apparaît sous la notation

G (r)

$G(r)$ .

cardinal

@whuber: Vous soulevez de bons points. Je n'avais pas non plus accès au document S&D, donc mes remarques ont été réduites à la conjecture. S'il nous arrive de nous rencontrer en personne, je vais échanger une histoire ou deux avec vous autour d'une bière sur les frustrations de traiter avec ceux qui insistent sur la moyenne des corrélations. Je suis entièrement d'accord avec vos commentaires sur la question. Cela dit, cela peut être logique dans certains contextes que je connais généralement moins. :)

Cardinal

Pour moi, l' r biasentrée rhode 0,5 dans le tableau Silver & Dunlap me semble la plus étrangement différente. Toutefois, cela dit, il ne correspond à votre valeur estimée tout à fait près.

Malheureusement, je n'ai pas accès au document Silver & Dunlap pour le moment, mais une recherche Google a révélé un document récent qui effectue une étude similaire à celle que vous avez effectuée. C'est

RL Gorsuch et CS Lehmann (2010), Coefficients de corrélation: biais moyen et distorsions d'intervalle de confiance , Journal of Methods and Measurement in the Social Sciences , vol. 1, non. 2, 52–65.

Voir en particulier leur tableau 3 qui, au moins à l'œil, semble corroborer vos résultats.

Je ne peux certainement pas garantir la qualité de la revue (ou de l'ensemble du papier), qui a l'air assez nouvelle et un peu rude sur les bords, à mon avis. Caveat lector.

Pour un traitement approfondi et plus théorique de l'inférence sur la corrélation (simple, partielle et multiple) principalement dans un cadre normal multivarié, une bonne référence est

FA Graybill, Théorie et application du modèle linéaire , Duxbury Press, 1976, chapitre 11 .

Cependant, il ne se préoccupe pas beaucoup des performances des petits échantillons ou des aspects appliqués.

cardinal
la source

Pourquoi ma réplication de Silver & Dunlap 1987 ne fonctionne-t-elle pas?

Réponses: