Existe-t-il une relation entre la similitude cosinus, la corrélation de Pearson et le score z?

16

Je me demande s'il y a une relation entre ces 3 mesures. Je n'arrive pas à établir un lien entre eux en me référant aux définitions (peut-être parce que je suis nouveau dans ces définitions et que j'ai un peu de mal à les comprendre).

Je sais que la plage de similitude cosinus peut être comprise entre 0 et 1, et que la corrélation de Pearson peut aller de -1 à 1, et je ne suis pas sûr de la plage du score z.

Je ne sais pas, cependant, comment une certaine valeur de similitude cosinus pourrait vous dire quoi que ce soit sur la corrélation de Pearson ou le z-score, et vice versa?

Jaken Herman
la source
1
z score de quoi ? Les scores z de certaines choses peuvent être liés à la corrélation de Pearson, les scores Z d'autres choses peuvent ne pas l'être. Par exemple, si vous standardisez en interne vos variables d'origine, la corrélation de Pearson entre x et y est le produit attendu de leurs z-scores. Ou vous pourriez parler de scores z des corrélations de Pearson (corrélations de Pearson moins leurs attentes sous certaines conditions, toutes divisées par l'erreur-type de la corrélation de Pearson), qui serait certainement liée à la corrélation de Pearson.
Glen_b -Reinstate Monica
1
Relation directe: stats.stackexchange.com/a/22520/3277
ttnphns

Réponses:

29

ab

cosθ=abab

Pour un vecteur le vecteur " score " serait généralement défini comme où et sont la moyenne et l'écart type de . Donc a une moyenne de 0 et un écart-type 1, c'est-à-dire que est la version standardisée de .z z = x - ˉ xxz ˉ x =1

z=xx¯sx
s 2 x = ¯ ( x - ˉ x ) 2 xzzxxx¯=1nixisx2=(xx¯)2¯xzzxx

Pour deux vecteurs et , leur coefficient de corrélation serait y ρ x , y = ¯ ( z x z y )xy

ρx,y=(zxzy)¯

Maintenant, si le vecteur a une moyenne nulle, sa variance sera , donc son vecteur unitaire et son score z seront liés par s 2 a = 1asa2=1na2

a^=aa=zan

Donc, si les vecteurs et sont centrés (c'est-à-dire ont des moyennes nulles), alors leur similitude en cosinus sera la même que leur coefficient de corrélation.ab

TL; DR La similitude cosinus est un produit scalaire de vecteurs unitaires. La corrélation de Pearson est la similitude cosinus entre les vecteurs centrés. La "transformation du score Z" d'un vecteur est le vecteur centré mis à l'échelle à une norme de .n

GeoMatt22
la source
+1. Commentaire latexnazi: \|semble souvent meilleur que ||, et \lVert ... \rVertest le meilleur moyen de l'écrire.
amibe dit Réintégrer Monica