Distribution des produits scalaires de deux vecteurs unitaires aléatoires en dimensions

27

Si et sont deux vecteurs unitaires aléatoires indépendants dans (uniformément répartis sur une sphère unitaire), quelle est la distribution de leur produit scalaire (produit scalaire) ?y R D xyxyRDxy

Je suppose que lorsque croît rapidement, la distribution (?) Devient normale avec une moyenne nulle et une variance décroissante dans les dimensions supérieures mais existe-t-il une formule explicite pour \ sigma ^ 2 (D) ?D

limDσ2(D)0,
σ2(D)

Mise à jour

J'ai fait quelques simulations rapides. Tout d'abord, en générant 10000 paires de vecteurs unitaires aléatoires pour D=1000 il est facile de voir que la distribution de leurs produits scalaires est parfaitement gaussienne (en fait, elle est déjà assez gaussienne pour D=100 ), voir la sous-intrigue à gauche. Deuxièmement, pour chaque D allant de 1 à 10 000 (avec des pas croissants), j'ai généré 1 000 paires et calculé la variance. Terrain Log-Log est indiqué à droite, et il est clair que la formule est très bien approchée par 1/D . Notez que pour D=1 et D=2 cette formule donne même des résultats exacts (mais je ne suis pas sûr de ce qui se passera plus tard).

produits scalaires entre vecteurs unitaires aléatoires

amibe dit réintégrer Monica
la source
@KarlOskar: merci, ce lien est très pertinent, et rend en fait ma question presque en double, mais pas tout à fait. Il existe donc une formule explicite pour qui est une fonction de distribution cumulative des produits scalaires. On peut prendre un dérivé pour obtenir le PDF puis étudier la limite . Cependant, la formule est donnée en termes de fonctions bêta et de fonctions bêta incomplètes, donc les calculs sont susceptibles d'être désagréables. D P{(x,y)>ϵ}D
amibe dit Réintégrer Monica le
@KarlOskar: de la distribution uniforme sur une sphère unitaire dans . Pour générer un vecteur aléatoire à partir de cette distribution, on peut générer un vecteur aléatoire à partir d'un gaussien avec une variance unitaire, puis le normaliser. RD
amoeba dit Reinstate Monica

Réponses:

30

Parce que ( comme cela est bien connu ) une distribution uniforme sur la sphère unitaire est obtenue en normalisant une distribution normale à variables et le produit scalaire des vecteurs normalisés est leur coefficient de corrélation, les réponses aux trois les questions sont: D tSD1Dt

  1. ( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 a une distribution bêta .((D1)/2,(D1)/2)

  2. La variance de est égale à (comme spéculé dans la question).1 / Dt1/D

  3. La distribution standardisée de rapproche de la normalité à un taux deO ( 1tO(1D).


Méthode

La distribution exacte du produit scalaire des vecteurs unitaires est facilement obtenue géométriquement, car c'est la composante du deuxième vecteur dans la direction du premier. Puisque le deuxième vecteur est indépendant du premier et est uniformément distribué sur la sphère unitaire, sa composante dans la première direction est distribuée de la même manière que n'importe quelle coordonnée de la sphère. (Notez que la distribution du premier vecteur n'a pas d'importance.)

Trouver la densité

Laissant cette coordonnée être la dernière, la densité à est donc proportionnelle à la surface située à une hauteur comprise entre et sur la sphère unitaire. Cette proportion se produit dans une ceinture de hauteur et de rayon qui est essentiellement un tronc conique construit à partir d'un de rayon de hauteur et de pente . D'où la probabilité est proportionnelle àt t + d t d t t[1,1]tt+dtdtS D - 2 1t2,SD2dt1/1t2,dt1/1t2

(1t2)D21t2dt=(1t2)(D3)/2dt.

Soit implique . La substitution de ce qui précède donne l'élément de probabilité jusqu'à une constante de normalisation:t = 2 u - 1u=(t+1)/2[0,1]t=2u1

fD(u)du(1(2u1)2)(D3)/2d(2u1)=2D2(uu2)(D3)/2du.

Il est immédiat que a une distribution Beta , car (par définition) sa densité est également proportionnelle à( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2((D1)/2,(D1)/2)

u(-1)/2-1(1-u)(-1)/2-1=(u-u2)(-3)/2F(u).

Déterminer le comportement limitatif

Des informations sur le comportement limitatif en découlent facilement à l'aide de techniques élémentaires: peut être intégré pour obtenir la constante de proportionnalité ; peut être intégré (en utilisant les propriétés des fonctions bêta, par exemple) pour obtenir des moments, montrant que la variance est et se réduit à (d'où, selon le théorème de Tchebychev, la probabilité se concentre près de ); et la distribution limite est alors trouvée en considérant les valeurs de la densité de la distribution standardisée, proportionnelle à pour les petites valeurs deΓ ( nFtkfD(t)1/D0t=0fD(t/Γ(n2)πΓ(-12)tkF(t)1/0t=0tF(t/),t :

log(fD(t/D))=C(D)+D32log(1t2D)=C(D)-(1/2+32)t2+O(t4)C-12t2

où les représentent des constantes (log) d'intégration. De toute évidence, la vitesse à laquelle cela se rapproche de la normalité (pour laquelle la densité logarithmique est égale à ) est- 1CO(1-12t2O(1).

Figure

Ce graphique montre les densités du produit scalaire pour , normalisées en fonction de la variance unitaire, et leur densité limite. Les valeurs à augmentent avec (du bleu au rouge, à l'or, puis au vert pour la densité normale standard). La densité pour serait impossible à distinguer de la densité normale à cette résolution.0 D D = 1000=4,6,dix0=1000

whuber
la source
4
(+1) Merci beaucoup, @whuber, c'est une excellente réponse! Remerciements particuliers pour avoir mentionné le mot "tronc". Il se trouve que j'ai accepté une autre réponse quelques minutes avant que vous ne publiiez la vôtre, et je ne voudrais pas la désaccepter maintenant; J'espère que tu as compris. Dommage qu'il ne soit pas possible d'accepter les deux! Soit dit en passant, notez une preuve très simple de l' expression pour la variance de cette réponse: on peut la voir directement sans déconner avec les fonctions bêta! La variance du produit scalaire est égale à la variance de n'importe quelle coordonnée de sphère (comme vous l'avez écrit), et une somme de tous les devrait être , QEDD 11/1
amibe dit Reinstate Monica
1
C'est une belle observation sur les écarts.
whuber
2
@amoeba, l'activité récente a également attiré mon attention ici, et autant que j'apprécie que vous ayez accepté ma réponse, celle-ci est beaucoup plus complète. Cela ne me dérangerait pas du tout si vous changiez.
ekvall
1
@ Student001: c'est un commentaire juste et généreux. J'ai changé la réponse acceptée. J'ai également trouvé un Q et un A à voter pour compenser cela :)
Amoeba dit Reinstate Monica
1
@mat La distribution de est celle de . Cela en fait une distribution bêta qui a été mise à l'échelle et décalée de l'intervalle dans l'intervalle . 2 U - 1 [ 0 , 1 ] [ - 1 , 1 ]t2U-1[0,1][-1,1]
whuber
11

Trouvons la distribution, puis la variance suit les résultats standard. Considérez le produit vectoriel et écrivez-le sur sa forme cosinus, c'est-à-dire que nous avons où est l'angle entre et . Dans la dernière étape, je l'ai utilisé pour tous les événements etConsidérons maintenant le terme . Il est clair que puisque est choisi uniformément par rapport à la surface de la sphère, peu importe ce queθ x y A B E P ( A B ) : = E [ E [ χ

P(xyt)=P(|x||y|cosθt)=P(cosθt)=EP(cosθty),
θXyUNEB P ( cos θ t y ) x y x y y y = [ 1 , 0 , 0 , ] . P ( x y t ) = P ( x 1t ) . x 1
EP(UNEB): =E[E[χUNEB]]=EχUNE=P(UNE).
P(cosθty)Xyest en fait, seul l'angle entre et compte. Ainsi, le terme à l'intérieur de l'attente est en fait constant en fonction de et nous pouvons wlog supposer queEnsuite, nous obtenons quemais comme est la première coordonnée d'un vecteur gaussien normalisé dans nous avons que est gaussien avec la variance en invoquant le résultat asymptotique de cet article .Xyyy=[1,0,0,].
P(Xyt)=P(X1t).
x1 x y1 / nRn,Xy1/n

Pour un résultat explicite de la variance, utilisez le fait que le produit scalaire est égal à zéro par indépendance et, comme indiqué ci-dessus, distribué comme la première coordonnée de . D'après ces résultats, trouver revient à trouver . Maintenant, notez que par construction et ainsi nous pouvons écrire où la dernière égalité découle de ce que les coordonnées de sont distribuées de manière identique. En rassemblant les choses, nous avons constaté queVar ( x y ) E x 2 1 x x = 1 1 = E x x = E n i = 1 x 2 i = n i = 1 E x 2 i = n E x 2 1 , x Var ( x y ) = E x 2 1XVar(Xy)Ex12xx=1

1=Exx=Ei=1nxi2=i=1nExi2=nEx12,
xVar(xy)=Ex12=1/n
ekvall
la source
Merci, mais je suis confus: quel est exactement "le résultat souhaité" et comment découle-t-il de la dernière équation? La distribution de probabilité finale devrait dépendre . D
amibe dit Réintégrer Monica le
En fait, la façon dont le résultat résulte de votre dernière équation est exactement ce qui est discuté sur le fil math.SE que vous avez trouvé. Cela implique des distributions bêta, etc., et le comportement limitant est (pour moi) loin d'être évident. Je suppose qu'il devrait y avoir un moyen plus simple directe de voir que . σ2(D)1/
amibe dit Réintégrer Monica le
Cela dépend de la dimension puisque , où est le vecteur gaussien généré. Je mettrai à jour la réponse plus tard dans la journée ou demain. X1=z1|z|-1z
ekvall
Wow, super, votre dernier lien fournit la limite de cette expression impliquant des fonctions bêta inverses (que j'avais peur de calculer) dans la troisième équation de la page 1. Donc, pour terminer le raisonnement: si la sphère a un rayon , alors est (asymptotiquement) distribué comme . Ce qui signifie que pour la sphère de la variance de rayon unitaire est fois plus faible, à savoir . Cependant, j'ai toujours une préoccupation: j'ai vérifié de 1 à 4, et semble donner une variance exacte , même si les distributions pour D = 1 ou D = 2 sont très loin de la normale. Il devrait y avoir une raison plus profonde derrière cela. X1N(0,1)1/1/
amoeba dit Reinstate Monica
@amoeba Oui, mis à jour avec une preuve de cela.
ekvall
2

Pour répondre à la première partie de votre question, notez . Définir Le produit des éléments de et notés ici comme seront distribués selon la distribution conjointe de et . puis depuis , Z=X,Oui=XjeOuije

FZje(zje)=-FZ1,,Z(z1,,z)zje
jethXOuiZjeXjeOuije
FZje(zje)=-FXje,Ouije(X,zjeX)1|X|X
Z=Zje
FZ(z)=--FZ1,,Z(z1,,z)δ(z-zje)z1z

Pour la deuxième partie, je pense que si vous voulez dire quelque chose d'intéressant sur le comportement asymptotique de vous devez au moins assumer l'indépendance de et , puis appliquer un CLT.σXOui

Par exemple, si vous vouliez supposer que les sont iid avec et vous pourriez disons que et .{Z1,,Z}E[Zje]=μV[Zje]=σ2σ2()=σ2limσ2()=0

à M
la source
Merci, mais je suis confus au sujet de la deuxième partie. et sont bien sûr censés être indépendants, j'ajouterai ceci à la question. Vous dites que , et cela semble raisonnable, mais quel est le comportement asymptotique de ? Je pense que l'expression que je cherche ne devrait dépendre que . Par ailleurs en 2D si je ne me trompe pas, je me demande si cela reste vrai dans les dimensions supérieures ...Y σ 2 ( D ) = V a r ( z i ) / D V a r ( z i ) D V a r ( z i ) = une / 2XOuiσ2()=Vuner(zje)/Vuner(zje)Vuner(zje)=1/2
amibe dit Reinstate Monica
Est-il vraiment possible que le soit indépendant étant donné l'exigence que et soient de longueur unitaire? X YzjeXOui
ekvall
@ Tom: Soit dit en passant, je suis erronée: en 2D est 1, il est qui est égal à 1/2. J'ai mis à jour ma question avec quelques résultats de simulation. Il semble que la bonne formule est . V a r ( z ) 1 / DVuner(zje)Vuner(z)1/
Amoeba dit Reinstate Monica