Avertissement: si vous trouvez que cette question est trop similaire à une autre, je suis heureux qu'elle soit fusionnée. Cependant, je n'ai pas trouvé de réponse satisfaisante ailleurs (et je n'ai pas encore la "réputation" de commenter ou de voter), donc j'ai pensé qu'il serait préférable de poser moi-même une nouvelle question.
Ma question est la suivante. Pour chacun des 12 sujets humains, j'ai calculé un coefficient de corrélation (rho de Spearman) entre 6 niveaux d'une variable indépendante X, et les observations correspondantes d'une variable dépendante Y. (Remarque: les niveaux de X ne sont pas égaux entre les sujets.) Mon l'hypothèse nulle est que dans la population générale, cette corrélation est égale à zéro. J'ai testé cette hypothèse de deux manières:
Utilisation d'un test t à un échantillon sur les coefficients de corrélation obtenus à partir de mes 12 sujets.
En centrant mes niveaux de X et mes observations de Y de telle sorte que pour chaque participant, moyenne (X) = 0 et moyenne (Y) = 0, puis calcul d'une corrélation sur les données agrégées (72 niveaux de X et 72 observations de Y) .
Maintenant, en lisant sur le travail avec les coefficients de corrélation (ici et ailleurs), j'ai commencé à douter de la validité de la première approche. En particulier, j'ai vu l'équation suivante apparaître à plusieurs endroits, présentée (apparemment) comme un test t pour les coefficients de corrélation moyens:
où serait le coefficient de corrélation moyen (et supposons que nous l'avons obtenu en utilisant d'abord la transformation de Fisher sur les coefficients par sujet) et le nombre d'observations. Intuitivement, cela me semble faux car il ne comprend aucune mesure de la variabilité entre les sujets. En d'autres termes, si j'avais 3 coefficients de corrélation, j'obtiendrais la même statistique t, qu'ils soient [0,1, 0,5, 0,9] ou [0,45 0,5 0,55] ou n'importe quelle plage de valeurs avec la même moyenne (et )n n = 3
Je soupçonne donc que l'équation ci-dessus ne s'applique pas en fait lors du test de la signification d'une moyenne de coefficients de corrélation, mais lors du test de la signification d'un seul coefficient de corrélation basé sur observations de 2 variables.
Quelqu'un ici pourrait-il confirmer cette intuition ou expliquer pourquoi elle est fausse? De plus, si cette formule ne s'applique pas à mon cas, quelqu'un connaît-il / la bonne approche? Ou peut-être que mon propre numéro de test 2 est déjà valide? Toute aide est grandement appréciée (y compris les pointeurs vers des réponses précédentes que j'ai peut-être manquées ou mal interprétées).
la source
Réponses:
Une meilleure approche pour analyser ces données consiste à utiliser un modèle mixte (aka modèle à effets mixtes, modèle hiérarchique) avec
subject
comme effet aléatoire (interception aléatoire ou interception aléatoire + pente). Pour résumer une réponse différente de la mienne:Il s'agit essentiellement d'une régression qui modélise une seule relation globale tout en permettant à cette relation de différer entre les groupes (les sujets humains). Cette approche bénéficie d'un regroupement partiel et utilise vos données plus efficacement.
la source
Je suppose que les variables ( et ) sont les mêmes pour tous les individus (en fait, je ne suis pas sûr de comprendre ce que vous voulez dire en disant que les niveaux ne sont pas égaux entre les sujets: j'espère que vous êtes se référant à l'indépendance entre les plages des variables, et non à quelles variables sont mesurées pour chaque individu). Oui, la formule que vous avez montrée s'applique au coefficient de corrélation entre deux variables.6 X 6 Y12 6 X 6 Y
Dans votre point 2, vous parlez de normalisation: je pense que cela aurait du sens si vous le faisiez pour chacune des variables séparément. Cependant, même ainsi, le problème avec cette approche est qu'elle ne contrôle pas la dépendance intra-individuelle.6∗2
Je crois que votre approche 1 n'est pas non plus valable, car ce serait un test parmi variables avec une distribution avec seulement degrés de liberté, donc je ne pense pas que vous puissiez appliquer le théorème de limite centrale dans ce cas.t 106 t 10
Peut-être, avec des nombres plus importants, vous pourriez utiliser une approche à effet aléatoire, permettant une pente aléatoire et testant simultanément à la fois un coefficient moyen nul (de sur ) et la non-existence d'un coefficient aléatoire. Je pense cependant que 6 variables et 12 observations ne suffisent pas.Y iXi Yi
Je vous suggère de le voir comme un test sur 6 valeurs (devenant 12 si vous considérez également les valeurs inférieures à la diagonale) de la matrice de corrélation parmi les variables (à la fois le et le ), c'est-à-dire celles sur la diagonale de la 2e (et de façon équivalente au 3e) quadrant. Ainsi, je ferais un test de rapport de vraisemblance entre le modèle restreint et le modèle non restreint.X Y12 X Y
@Alexis Je crois comprendre que centrer , , en les remplaçant par aurait du sens (je pense qu'il serait également logique de les diviser par leur ). De cette façon, les variables et (créées en considérant les comme si elles étaient des occurrences d'une variable unique, et les mêmes pour ) auraient toutes une moyenne de . Au contraire, si nous construisons d'abord deux variables (créées en considérantX1,…,X6 Y1,…,Y6 X∗1=X1−X1¯,…,X∗6=X6−X6¯,Y∗1=Y1−Y1¯,…,Y∗6=Y6−Y6¯ SE X∗ Y∗ X∗i,1≤i≤6 Y∗i 0 X,Y Xi,1≤i≤6 comme s'il s'agissait d'occurrences d'une variable unique, et la même chose pour ), alors bien sûr, soustraire la moyenne (et aussi la diviser par le SE de et ) ne changerait rien.Yi X Y
EDIT 01/01/18
Soit la variable et ( ) l'individu. Supposons alors que nous ayons:i j 1≤j≤12
La corrélation dans ce cas devrait être de .0.5428
Si nous centrons chaque variable, étant donné que, pour , et n'ont aucune variation, nous avons: . Quant à , nous obtenons les valeurs (c'est dire pour les : et exactement le contraire pour les ). Puisque et , on obtient: , impliquant une corrélation de .1≤i≤5 Xi Yi X∗ij=Y∗ij=0 i=6 X∗6j=j−6.5,Y∗j6=(13−j)−6.5=6.5−j X −5.5,−4.5,−3.5,−2.5,−1.5,−0.5,0.5,1.5,2.5,3.5,4.5,5.5 Y 0=−0 j−6.5=−(6.5−j) X∗ij=−Y∗ij∀i,j→X∗=−Y∗ −1
la source