Je me demande s'il y a une relation entre ces 3 mesures. Je n'arrive pas à établir un lien entre eux en me référant aux définitions (peut-être parce que je suis nouveau dans ces définitions et que j'ai un peu de mal à les comprendre).
Je sais que la plage de similitude cosinus peut être comprise entre 0 et 1, et que la corrélation de Pearson peut aller de -1 à 1, et je ne suis pas sûr de la plage du score z.
Je ne sais pas, cependant, comment une certaine valeur de similitude cosinus pourrait vous dire quoi que ce soit sur la corrélation de Pearson ou le z-score, et vice versa?
correlation
z-score
cosine-similarity
Jaken Herman
la source
la source
Réponses:
Pour un vecteur le vecteur " score " serait généralement défini comme où et sont la moyenne et l'écart type de . Donc a une moyenne de 0 et un écart-type 1, c'est-à-dire que est la version standardisée de .z z = x - ˉ xx z ˉ x =1
Pour deux vecteurs et , leur coefficient de corrélation serait y ρ x , y = ¯ ( z x z y )x y
Maintenant, si le vecteur a une moyenne nulle, sa variance sera , donc son vecteur unitaire et son score z seront liés par s 2 a = 1a s2a=1n∥a∥2
Donc, si les vecteurs et sont centrés (c'est-à-dire ont des moyennes nulles), alors leur similitude en cosinus sera la même que leur coefficient de corrélation.a b
TL; DR La similitude cosinus est un produit scalaire de vecteurs unitaires. La corrélation de Pearson est la similitude cosinus entre les vecteurs centrés. La "transformation du score Z" d'un vecteur est le vecteur centré mis à l'échelle à une norme de .n−−√
la source
\|
semble souvent meilleur que||
, et\lVert ... \rVert
est le meilleur moyen de l'écrire.