Un examinateur m'a demandé si les corrélations de Pearson (valeurs r) présentées dans un tableau peuvent être comparées les unes aux autres, de sorte que l'on peut affirmer que l'une est "plus forte" qu'une autre (autre que de simplement regarder les valeurs r réelles) .
Comment vous y prendriez-vous? J'ai trouvé cette méthode
http://vassarstats.net/rdiff.html
mais je ne sais pas si cela s'applique.
correlation
pearson-r
method-comparison
pecorino
la source
la source
Réponses:
(Je suppose que vous parlez de r obtenus à partir d'un échantillon.)
Le test sur ce site Web s'applique en ce sens qu'il traite r comme tout paramètre dont la valeur peut différer entre deux populations. En quoi r diffère-t-il de toute autre mesure, telle que la moyenne, que vous êtes très confiant en comparant, en utilisant le test t ? Eh bien, c'est différent en ce qu'il est lié entre -1,1, il n'a pas la bonne distribution, donc vous devez le transformer par Fisher avant de faire l'inférence (et le transformer ensuite après, si vous voulez par exemple obtenir un CI). Les scores z résultant du test ont la forme appropriée pour faire l'inférence. C'est ce que fait le test auquel vous vous connectez.
Donc, ce que vous liez est une procédure permettant de déduire ce qui pourrait arriver si vous pouviez obtenir le r pour la totalité de la population (s) à partir de laquelle vous échantillonnez - le r pour un groupe serait-il plus élevé que pour l'autre, ou ils sont exactement les mêmes? Appelons cette dernière hypothèse H . Si le test renvoie une valeur p faible , cela implique que, sur la base de votre échantillon, vous devriez avoir peu de confiance dans l'hypothèse que la vraie valeur de la différence entre les deux r serait exactement 0 (car de telles données se produiraient rarement si la différence de r était exactement 0). Sinon, vous n'avez pas les données pour rejeter, en toute confiance, cette hypothèse d'égalité précise0 r , soit parce que c'est vrai et / ou parce que votre échantillon est insuffisant. Notez que j'aurais pu faire la même histoire sur la différence de moyens (en utilisant le test t ), ou toute autre mesure.
Une question complètement différente est de savoir si la différence entre les deux serait significative . Malheureusement, il n'y a pas de réponse simple à cela, et aucun test statistique ne peut vous donner la réponse. Peut-être que la vraie valeur (la valeur de la population, pas celle que vous observez) de r est de 0,5 dans l'un et de 0,47 dans l'autre groupe. Dans ce cas, l'hypothèse statistique de leur équivalence (notre H ) serait fausse. Mais est-ce une différence significative ? Cela dépend - quelque chose de l'ordre de 3% plus de variance expliquée est-il significatif ou vide de sens? Cohen a donné des directives approximatives pour interpréter r (et vraisemblablement, les différences entre r0 's), mais ne l'a fait que sous le conseil qu'il ne s'agit que d'un point de départ. Et vous ne connaissez même pas la différence exacte, même si vous faites une inférence, par exemple en calculant l'IC pour les différences entre les deux corrélations. Très probablement, une gamme de différences possibles sera compatible avec vos données.
Un pari relativement sûr serait de calculer les intervalles de confiance pour vos r et peut-être l'IC pour leur différence, et de laisser le lecteur décider.
la source