Existe-t-il une relation mathématique entre:
- la similitude cosinus de deux vecteurs et , et
- la similitude cosinus de et , mis à l'échelle de manière non uniforme via une matrice donnée ? Ici est une matrice diagonale donnée avec des éléments inégaux sur la diagonale.
J'ai essayé de parcourir les calculs, mais je n'ai pas pu atteindre un lien (expression) simple / intéressant. Je me demande s'il y en a un.
Par exemple, les angles ne sont pas conservés dans une mise à l'échelle non uniforme, mais quelle est la relation entre les angles d'origine et ceux après la mise à l'échelle non uniforme? Que peut-on dire du lien entre un ensemble de vecteurs S1 et un autre ensemble de vecteurs S2 - où S2 est obtenu par une mise à l'échelle non uniforme de S1?
linear-algebra
cosine-similarity
turdus-merula
la source
la source
Réponses:
Parce que est assez général, et le changement de similitude cosinus dépend des et et de leur relation avec , aucune formule définie n'est possible. Cependant, il existe des limites pratiquement calculables à combien la similitude cosinus peut changer . On peut les trouver en extrémisant l'angle entre et étant donné que la similitude en cosinus entre et est une valeur spécifiée, disons (où est l'angle entre et ). La réponse nous indique combien d'angleA B M M A M B A B cos ( 2 ϕ ) 2 ϕ A B 2 ϕ MM A B M MA MB A B cos(2ϕ) 2ϕ A B 2ϕ peut éventuellement être courbé par la transformation .M
Les calculs menacent d'être désordonnés. Certains choix astucieux de notation, ainsi que quelques simplifications préliminaires, réduisent l'effort. Il s'avère que la solution en deux dimensions révèle tout ce que nous devons savoir. Il s'agit d'un problème traitable, dépendant uniquement d'une variable réelle , qui est facilement résolu en utilisant des techniques de calcul. Un simple argument géométrique étend cette solution à n'importe quel nombre de dimensions .nθ n
Préliminaires mathématiques
Par définition, le cosinus de l'angle entre deux vecteurs et quelconques est obtenu en les normalisant à la longueur unitaire et en prenant leur produit. Donc,BA B
et, en écrivant , le cosinus de l'angle entre les images de et sous la transformation estA B MΣ=M′M A B M
Notez que seul compte dans l'analyse,Σ pas lui-même. Nous pouvons donc exploiter la décomposition en valeurs singulières (SVD) de pour simplifier le problème. Rappelons que cela exprime comme un produit (de droite à gauche) d'une matrice orthogonale , d'une matrice diagonale et d'une autre matrice orthogonale :M M V ′ D UM M M V′ ré U
En d'autres termes, il existe une base de vecteurs privilégiés (les colonnes de ) sur lesquels agit en redimensionnant chaque séparément par l' entrée diagonale de (que j'appellerai ) et ensuite appliquer une rotation (ou anti-rotation) au résultat. Cette rotation finale ne changera aucune longueur ou angle et ne devrait donc pas affecter . Vous pouvez le voir formellement avec le calcul V M e i i th D d i U Σe1, … , En V M eje jee ré réje U Σ
Par conséquent, pour étudier nous pouvons remplacer librement par toute autre matrice qui produit les mêmes valeurs dans . En ordonnant le sorte que le diminue en taille (et en supposant que n'est pas identique à zéro), un bon choix de estM ( 1 ) e i d i M MΣ M (1) ei di M M
Les éléments diagonaux de sont( 1 / j1) D
Plus précisément, l'effet de (que ce soit dans sa forme originale ou modifiée) sur tous les angles est complètement déterminé par le fait queM
Analyse d'un cas particulier
Soit . Parce que changer les longueurs des vecteurs ne change pas l'angle entre eux, nous pouvons supposer que et sont des vecteurs unitaires. Dans le plan, tous ces vecteurs peuvent être désignés par l'angle qu'ils font avec , ce qui nous permet d'écrireA B e 1n = 2 UNE B e1
Donc
(Voir la figure ci-dessous.)
L'application de est simple: elle fixe les premières coordonnées de et et multiplie leurs secondes coordonnées par . Par conséquent, l'angle de à estA B λ 2 M A M BM A B λ2 MA MB
Parce que est une fonction continue, cette différence d'angles est une fonction continue de . En fait, c'est différentiable. Cela nous permet de trouver les angles extrêmes en inspectant les zéros de la dérivée . Cette dérivée est simple à calculer: c'est un rapport de fonctions trigonométriques. Les zéros ne peuvent apparaître que parmi les zéros de son numérateur, donc ne nous donnons pas la peine de calculer le dénominateur. On obtientθ f ′ ( θ )M θ f′(θ)
Les cas particuliers de , et sont faciles à comprendre: ils correspondent aux situations où est de rang réduit (et écrase donc tous les vecteurs sur une ligne); où est un multiple de la matrice d'identité; et où et sont parallèles (d'où l'angle entre eux ne peut pas changer, indépendamment de ). Le cas est exclu par la condition .λ 2 = 1 ϕ = 0 M M A B θ λ 2 = - 1 λ 2 ≥ 0λ2=0 λ2=1 ϕ=0 M M A B θ λ2=−1 λ2≥0
En dehors de ces cas particuliers, les zéros ne se produisent que lorsque : c'est-à-dire ou . Cela signifie que la ligne déterminée par bissecte l'angle . Nous savons maintenant que les valeurs extrêmes de l'angle entre et doivent se situer parmi les valeurs de , alors calculons-les:θ = 0 θ = π / 2 e 1 A B M A M B f ( θ )sin(2θ)=0 θ=0 θ=π/2 e1 AB MA MB f(θ)
Les cosinus correspondants sont
et
Souvent, il suffit de comprendre comment déforme les angles droits. Dans ce cas, , conduisant à , que vous pouvez brancher dans les formules précédentes.2 ϕ = π / 2 tan ( ϕ ) = lit bébé ( ϕ ) = 1M 2ϕ=π/2 tan(ϕ)=cot(ϕ)=1
Notez que plus devient petit , plus ces angles deviennent extrêmes et plus la distorsion est grande.λ2
Cette figure montre quatre configurations des vecteurs et séparés par un angle de . Le cercle unitaire et son image elliptique sous sont ombrés pour référence (avec l'action de uniformément redimensionnée pour faire ). Les en- têtes des figures indiquent la valeur de , le point médian de et . Le plus proche de ces et peut se produire lorsqu'il est transformé par est une configuration comme celle de gauche avecB 2 ϕ = π / 3 M M λ 1 = 1 θ A B A B M θ = 0 θ = π / 2A B 2ϕ=π/3 M M λ1=1 θ A B A B M θ=0 . Le plus éloigné possible est une configuration comme celle de droite avec . Deux possibilités intermédiaires sont présentées.θ=π/2
Solution pour toutes les dimensions
Nous avons vu comment agit en développant chaque dimension d'un facteur . Cela déformera la sphère unitaire en un ellipsoïde. Les déterminent ses axes principaux. Les sont les distances de l'origine, le long de ces axes, à l'ellipsoïde. Par conséquent, la plus petite, , est la distance la plus courte (dans toutes les directions) de l'origine à l'ellipsoïde et la plus grande, , est la distance la plus éloignée (dans toutes les directions) de l'origine à l'ellipsoïde.i λ i { AM i λi e i λ i λ n λ 1{A|A′A=1} ei λi λn λ1
Dans les dimensions supérieures , et font partie d'un sous-espace bidimensionnel. cartographie le cercle unitaire de ce sous-espace à l'intersection de l'ellipsoïde avec un plan contenant et . Cette intersection, étant une distorsion linéaire d'un cercle, est une ellipse. Évidemment, la distance la plus éloignée de cette ellipse n'est pas supérieure à et la distance la plus courte n'est pas inférieure à .A B M M A M B λ 1 = 1 λ nn>2 A B M MA MB λ1=1 λn
Comme nous l'avons observé à la fin de la section précédente, la possibilité la plus extrême est lorsque et sont situés dans un plan contenant deux des pour lesquels le rapport des correspondants est aussi petit que possible. Cela se produira dans le plan . Nous avons déjà la solution pour ce cas.B e i λ i e 1 , e nA B ei λi e1,en
Conclusions
Les extrêmes de similitude cosinus atteignables en appliquant à deux vecteurs ayant une similitude cosinus sont donnés par et . Ils sont atteints en situant et à angles égaux dans une direction dans laquelle allonge au maximum tout vecteur (comme la direction ) et en les séparant dans une direction dans laquelle allonge au minimum tout vecteur ( comme la direction ).M ( 2 ) ( 3 ) A B Σ = M ′ M e 1 Σ e ncos(2ϕ) (2) (3) A B Σ=M′M e1 Σ en
Ces extrêmes peuvent être calculées en fonction de la SVD de .M
la source
Vous êtes probablement intéressé par:
Vous pouvez diagonaliser (ou comme vous l'appelez, PCA), ce qui vous indique que la similitude de sous la transformation se comporte en projetant sur vos principaux composants, puis calculer la similitude dans ce nouvel espace. Pour étoffer cela un peu plus, laissez les composants principaux être avec des valeurs propres . alors A , B M A , B u i λ iMTM=UΣ UT A , B M A , B uje λje
ce qui vous donne:
Notez qu'il y a une mise à l'échelle ici: les s'étirent / se rétrécissent. Lorsque sont des vecteurs unitaires et si chaque , alors correspond à une rotation, et vous obtenez: , qui est équivaut à dire que les produits intérieurs sont invariants lors des rotations. En général, l'angle reste le même lorsque est une transformation conforme, ce qui dans ce cas nécessite que soit inversible et la décomposition polaire de satisfait avec , c'est-à-dire . A , B λ i = 1 M sim ( M A , M B ) = sim ( A , B ) M M M M = O P P = a I M T M = a 2 Iλi A,B λi=1 M sim(MA,MB)=sim(A,B) M M M M=OP P=aI MTM=a2I
la source