Supposons que j'ai une grande population de points de données et que la corrélation de Pearson soit
Que puis-je raisonnablement dire sur la corrélation que je m'attends à observer dans un échantillon de taille ? Si la corrélation d'échantillon est , quelle est approximativement la répartition est ? Est biaisés?
Si nous faisons certaines hypothèses comme la normalité, pouvons-nous calculer la fonction de vraisemblance exacte de en fonction de ?
(En fin de compte, je me demande si une corrélation élevée observée est un coup de chance ou non, et tout ce que j'ai, c'est la taille de l'échantillon et la corrélation.)
correlation
Mark Eichenlaub
la source
la source
Réponses:
Pour citer l'article Wikipedia sur la transformation de Fisher :
Si a une distribution normale bivariée, et si les paires utilisées pour former le coefficient de corrélation d'échantillon sont indépendantes pour alors est distribué normalement normalement avec la moyenne et l'erreur standard où est la taille de l'échantillon.(X,Y) (Xi,Yi) r i=1,…,n,
la source