Si et sont deux vecteurs unitaires aléatoires indépendants dans (uniformément répartis sur une sphère unitaire), quelle est la distribution de leur produit scalaire (produit scalaire) ?y R D x ⋅ y
Je suppose que lorsque croît rapidement, la distribution (?) Devient normale avec une moyenne nulle et une variance décroissante dans les dimensions supérieures mais existe-t-il une formule explicite pour \ sigma ^ 2 (D) ?
Mise à jour
J'ai fait quelques simulations rapides. Tout d'abord, en générant 10000 paires de vecteurs unitaires aléatoires pour il est facile de voir que la distribution de leurs produits scalaires est parfaitement gaussienne (en fait, elle est déjà assez gaussienne pour ), voir la sous-intrigue à gauche. Deuxièmement, pour chaque allant de 1 à 10 000 (avec des pas croissants), j'ai généré 1 000 paires et calculé la variance. Terrain Log-Log est indiqué à droite, et il est clair que la formule est très bien approchée par . Notez que pour et cette formule donne même des résultats exacts (mais je ne suis pas sûr de ce qui se passera plus tard).
la source
Réponses:
Parce que ( comme cela est bien connu ) une distribution uniforme sur la sphère unitaire est obtenue en normalisant une distribution normale à variables et le produit scalaire des vecteurs normalisés est leur coefficient de corrélation, les réponses aux trois les questions sont: D tSD - 1 ré t
( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u = ( t + 1 ) / 2 a une distribution bêta .( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
La variance de est égale à (comme spéculé dans la question).1 / Dt 1 / D
La distribution standardisée de rapproche de la normalité à un taux deO ( 1t O ( 1ré) .
Méthode
La distribution exacte du produit scalaire des vecteurs unitaires est facilement obtenue géométriquement, car c'est la composante du deuxième vecteur dans la direction du premier. Puisque le deuxième vecteur est indépendant du premier et est uniformément distribué sur la sphère unitaire, sa composante dans la première direction est distribuée de la même manière que n'importe quelle coordonnée de la sphère. (Notez que la distribution du premier vecteur n'a pas d'importance.)
Trouver la densité
Laissant cette coordonnée être la dernière, la densité à est donc proportionnelle à la surface située à une hauteur comprise entre et sur la sphère unitaire. Cette proportion se produit dans une ceinture de hauteur et de rayon qui est essentiellement un tronc conique construit à partir d'un de rayon de hauteur et de pente . D'où la probabilité est proportionnelle àt t + d t d t √t ∈ [ - 1 , 1 ] t t + dt rét S D - 2 √1 - t2-----√, SD - 2 dt1/ √1 - t2-----√, rét Une / une - t2-----√
Soit implique . La substitution de ce qui précède donne l'élément de probabilité jusqu'à une constante de normalisation:t = 2 u - 1u = ( t + 1 ) / 2 ∈ [ 0 , 1 ] t = 2 u - 1
Il est immédiat que a une distribution Beta , car (par définition) sa densité est également proportionnelle à( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u = ( t + 1 ) / 2 ( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
Déterminer le comportement limitatif
Des informations sur le comportement limitatif en découlent facilement à l'aide de techniques élémentaires: peut être intégré pour obtenir la constante de proportionnalité ; peut être intégré (en utilisant les propriétés des fonctions bêta, par exemple) pour obtenir des moments, montrant que la variance est et se réduit à (d'où, selon le théorème de Tchebychev, la probabilité se concentre près de ); et la distribution limite est alors trouvée en considérant les valeurs de la densité de la distribution standardisée, proportionnelle à pour les petites valeurs deΓ ( nFré tkfD(t)1/D0t=0fD(t/√Γ ( n2)π√Γ ( D - 12) tkFré( t ) 1 / D 0 t = 0 tFré( t / D--√) , t :
où les représentent des constantes (log) d'intégration. De toute évidence, la vitesse à laquelle cela se rapproche de la normalité (pour laquelle la densité logarithmique est égale à ) est- 1C O(1−12t2 O(1D).
Ce graphique montre les densités du produit scalaire pour , normalisées en fonction de la variance unitaire, et leur densité limite. Les valeurs à augmentent avec (du bleu au rouge, à l'or, puis au vert pour la densité normale standard). La densité pour serait impossible à distinguer de la densité normale à cette résolution.0 D D = 1000D=4,6,10 0 D D=1000
la source
Trouvons la distribution, puis la variance suit les résultats standard. Considérez le produit vectoriel et écrivez-le sur sa forme cosinus, c'est-à-dire que nous avons où est l'angle entre et . Dans la dernière étape, je l'ai utilisé pour tous les événements etConsidérons maintenant le terme . Il est clair que puisque est choisi uniformément par rapport à la surface de la sphère, peu importe ce queθ x y A B E P ( A ∣ B ) : = E [ E [ χ
Pour un résultat explicite de la variance, utilisez le fait que le produit scalaire est égal à zéro par indépendance et, comme indiqué ci-dessus, distribué comme la première coordonnée de . D'après ces résultats, trouver revient à trouver . Maintenant, notez que par construction et ainsi nous pouvons écrire où la dernière égalité découle de ce que les coordonnées de sont distribuées de manière identique. En rassemblant les choses, nous avons constaté queVar ( x ′ y ) E x 2 1 x ′ x = 1 1 = E x ′ x = E n ∑ i = 1 x 2 i = n ∑ i = 1 E x 2 i = n E x 2 1 , x Var ( x ′ y ) = E x 2 1X Var ( x′y) E x21 X′x = 1
la source
Pour répondre à la première partie de votre question, notez . Définir Le produit des éléments de et notés ici comme seront distribués selon la distribution conjointe de et . puis depuis ,Z= ⟨ X, Y⟩ = ∑ XjeOuije
Pour la deuxième partie, je pense que si vous voulez dire quelque chose d'intéressant sur le comportement asymptotique de vous devez au moins assumer l'indépendance de et , puis appliquer un CLT.σ X Oui
Par exemple, si vous vouliez supposer que les sont iid avec et vous pourriez disons que et .{ Z1, … , Zré} E [ Zje] = μ V [ Zje] = σ2 σ2( D ) = σ2ré limD → ∞σ2( D ) = 0
la source