Supposons que nous ayons points dans un rectangle avec lié , et ces points sont uniformément répartis dans ce plan. (Je ne connais pas très bien les statistiques, donc je ne connais pas la différence entre choisir uniformément un nœud dans la zoneou choisissez uniformément -axe de et -axe de indépendamment).
Étant donné un seuil de distance , Je voudrais peut-être connaître la probabilité que la distance euclidienne de deux points soit inférieure à , ou plus précisément, combien de paires de nœuds la distance sera inférieure à ?
Peut-être que la description suivante serait sans ambiguïté.
Permettez-moi de préciser ce problème. Donné nœuds et seuil . Celles-ci les points sont uniformément répartis dans un rectangle . Indique une variable aléatoire comme le nombre de paires de points à distance . Trouver.
la source
probability
.Réponses:
Nous pouvons résoudre ce problème analytiquement en utilisant une certaine intuition géométrique et des arguments . Malheureusement, la réponse est assez longue et un peu compliquée.
Configuration de base
Commençons par définir quelques notations. Supposons que nous dessinons uniformément des points au hasard à partir du rectangle[ 0 , a ] × [ 0 , b ] . Nous supposons sans perte de généralité que0 < b < a . Laisser(X1,Oui1) être les coordonnées du premier point et (X2,Oui2) être les coordonnées du deuxième point. Alors,X1 , X2 , Oui1 , et Oui2 sont mutuellement indépendants avec Xje distribué uniformément sur [ 0 , a ] et Ouije distribué uniformément sur [ 0 , b ] .
Considérez la distance euclidienne entre les deux points. C'est
Distributions triangulaires
DepuisX1 et X2 sont des uniformes indépendants, alors X1-X2 a une distribution triangulaire, d'où Z1= |X1-X2| a une distribution avec fonction de densité
Notez que depuisZ1 est fonction uniquement des deux Xje et Z2 est fonction uniquement du Ouije , puis Z1 et Z2 sont indépendants. La distance entre les points est donc la norme euclidienne de deux variables aléatoires indépendantes (avec des distributions différentes).
Le panneau de gauche de la figure montre la répartition desX1-X2 et le panneau de droite montre Z1= |X1-X2| où a = 5 dans cet exemple.
Quelques probabilités géométriques
DoncZ1 et Z2 sont indépendants et sont pris en charge sur [ 0 , a ] et [ 0 , b ] respectivement. Pour fixeré , la fonction de distribution de la distance euclidienne est
Nous pouvons penser à cela géométriquement comme ayant une distribution sur le rectangle et considérant un quart de cercle de rayon . Nous aimerions connaître la probabilité qui se trouve à l' intersection de ces deux régions. Il y a trois possibilités différentes à considérer:[ 0 , a ] × [ 0 , b ] ré
Région 1 (orange): . Ici, le quart de cercle se trouve complètement dans le rectangle.0 ≤ d< b
Région 2 (rouge): . Ici, le quart de cercle coupe le rectangle le long des bords supérieur et inférieur.b ≤ d≤ a
Région 3 (bleu): . Le quart de cercle coupe le rectangle le long des bords supérieur et droit.a < d≤une2+b2------√
Voici une figure, où nous dessinons un exemple de rayon de chacun des trois types. Le rectangle est défini par , . La niveaux de gris dans le rectangle montre la densité où les zones sombres ont une densité plus élevée et les zones plus claires ont une densité plus faible. Cliquez sur la figure pour en ouvrir une version agrandie.a = 5 b = 4 Fune(z1)Fb(z2)réz1réz2
Un peu de calcul laid
Pour calculer les probabilités, nous devons faire du calcul. Examinons tour à tour chacune des régions et nous verrons qu'une intégrale commune se formera. Cette intégrale a une forme fermée, bien qu'elle ne soit pas très jolie.
Région 1 : .0 ≤ d< b
Maintenant, l'intégrale intérieure donne . Il nous reste donc à calculer une intégrale de la forme où dans ce cas de intérêt . L'antériorité de l'intégrale est1une2ré2-y2------√( 2 a -ré2-y2------√)
On en déduit que .P (D≤d) =2une2b2( G ( d) - G ( 0 ) )
Région 2 : .b ≤ d≤ a
Région 3 : .a < d≤une2+b2------√
Ci-dessous est une simulation de 20000 points où nous traçons la distribution empirique sous forme de points gris et la distribution théorique sous forme de ligne, colorée en fonction de la région particulière qui s'applique.
À partir de la même simulation, nous traçons ci-dessous les 100 premières paires de points et dessinons des lignes entre eux. Chacun est coloré en fonction de la distance entre la paire de points et dans quelle région cette distance se situe.
Le nombre attendu de paires de points dans la distance est simplement par linéarité de l'espérance.ré
la source
Si les points sont vraiment uniformément distribués, c'est-à-dire dans un motif connu fixe, alors pour n'importe quelle distance d, vous pouvez simplement boucler sur toutes les paires et compter celles à l'intérieur de la distance. Votre probabilité est (ce nombre / n).
Si vous avez la liberté supplémentaire de choisir comment les n points sont distribués / sélectionnés, alors c'est la version rectangulaire du paradoxe de Bertrand . Cette page montre un certain nombre de façons de répondre à cette question en fonction de la façon dont vous distribuez vos points.
la source