Comparaison des coefficients de corrélation

11

J'ai deux ensembles de données où j'ai à ~ 250 000 valeurs pour 78 et 35 échantillons. Certains des échantillons appartiennent à une famille et cela peut avoir un effet sur les données. J'ai calculé la corrélation par paire et elle varie entre 0,7 et 0,95 mais je voudrais savoir s'il y a une différence significative dans les coefficients de corrélation intra vs inter famille? Quelle est la meilleure façon de procéder? Merci

biomed
la source

Réponses:

6

Une manière générale de comparer deux coefficients de corrélation consiste à utiliser la méthode de transformée z de Fisher, qui dit que est approximativement normal avec la moyenne et l'écart type . Si les échantillons sont indépendants, vous transformez chaque coefficient de corrélation et la différence entre les deux corrélations transformées sera normale avec la moyenne et écart type . À partir de cela, vous pouvez former une statistique et effectuer des tests comme vous le feriez dans un test ordinaire à deux échantillons .ρ^1,ρ^2arctanh(ρ^)arctanh(ρ)1/n3arctanh(ρ1)arctanh(ρ2)1/(n13)+1/(n23)zz

Macro
la source
2

Bien que la réponse de @ Macro soit agréable, elle nécessite une hypothèse sur la (in) dépendance des statistiques. Une autre approche consisterait à utiliser le bootstrap. L'idée serait de garder une variable fixe et de mélanger l'autre variable, de calculer la corrélation pour chacun de vos échantillons et de prendre leur différence. Répétez plusieurs fois pour obtenir une distribution et utilisez cette distribution pour tester l'hypothèse que les corrélations sont les mêmes. La structure de votre ensemble de données n'est pas très claire pour moi, il est donc difficile de fournir plus de détails.

Charlie
la source