Probabilité que des points uniformément aléatoires dans un rectangle aient une distance euclidienne inférieure à un seuil donné

8

Supposons que nous ayons n points dans un rectangle avec lié [0,a]×[0,b], et ces points sont uniformément répartis dans ce plan. (Je ne connais pas très bien les statistiques, donc je ne connais pas la différence entre choisir uniformément un nœud dans la zone[0,a]×[0,b]ou choisissez uniformément x-axe de [0,a] et y-axe de [0,b] indépendamment).

Étant donné un seuil de distance d, Je voudrais peut-être connaître la probabilité que la distance euclidienne de deux points soit inférieure à d, ou plus précisément, combien de paires de nœuds la distance sera inférieure à d?


Peut-être que la description suivante serait sans ambiguïté.

Permettez-moi de préciser ce problème. Donnén nœuds et seuil d. Celles-cin les points sont uniformément répartis dans un rectangle [0,a]×[0,b]. Indique une variable aléatoireξ comme le nombre de paires de points à distance d. TrouverE[ξ].

zhouzhuojie
la source
Vous devriez également parcourir les questions de math.SE , car j'en rappelle plusieurs connexes. Ils sont probablement étiquetés probability.
Cardinal
1
Voici quelques-unes des questions dont je me souvenais avoir vu sur math.SE, mais aucune d'entre elles n'est tout à fait ce que vous demandez: ( 1 ) math.stackexchange.com/questions/64028 ( 2 ) math.stackexchange.com/questions/66777 ( 3 ) math.stackexchange.com/questions/101692 ( 4 ) math.stackexchange.com/questions/50775
cardinal

Réponses:

15

Nous pouvons résoudre ce problème analytiquement en utilisant une certaine intuition géométrique et des arguments . Malheureusement, la réponse est assez longue et un peu compliquée.

Configuration de base

Commençons par définir quelques notations. Supposons que nous dessinons uniformément des points au hasard à partir du rectangle[0,a]×[0,b]. Nous supposons sans perte de généralité que0<b<a. Laisser(X1,Y1) être les coordonnées du premier point et (X2,Y2)être les coordonnées du deuxième point. Alors,X1, X2, Y1, et Y2 sont mutuellement indépendants avec Xi distribué uniformément sur [0,a] et Yi distribué uniformément sur [0,b].

Considérez la distance euclidienne entre les deux points. C'est

D=(X1X2)2+(Y1Y2)2=:Z12+Z22,
Z1=|X1X2| et Z2=|Y1Y2|.

Distributions triangulaires

Depuis X1 et X2 sont des uniformes indépendants, alors X1X2 a une distribution triangulaire, d'où Z1=|X1X2| a une distribution avec fonction de densité

fa(z1)=2a2(az1),0<z1<a.
La fonction de distribution correspondante est Fa(z1)=1(1z1/a)2 pour 0z1a. De même,Z2=|Y1Y2| a une densité fb(z2) et fonction de distribution Fb(z2).

Notez que depuis Z1 est fonction uniquement des deux Xi et Z2 est fonction uniquement du Yi, puis Z1 et Z2sont indépendants. La distance entre les points est donc la norme euclidienne de deux variables aléatoires indépendantes (avec des distributions différentes).

Le panneau de gauche de la figure montre la répartition des X1X2 et le panneau de droite montre Z1=|X1X2|a=5 dans cet exemple.

Densités triangulaires

Quelques probabilités géométriques

Donc Z1 et Z2 sont indépendants et sont pris en charge sur [0,a] et [0,b]respectivement. Pour fixed, la fonction de distribution de la distance euclidienne est

P(Dd)={z12+z22d2}fa(z1)fb(z2)dz1dz2.

Nous pouvons penser à cela géométriquement comme ayant une distribution sur le rectangle et considérant un quart de cercle de rayon . Nous aimerions connaître la probabilité qui se trouve à l' intersection de ces deux régions. Il y a trois possibilités différentes à considérer:[0,a]×[0,b]d

Région 1 (orange): . Ici, le quart de cercle se trouve complètement dans le rectangle.0d<b

Région 2 (rouge): . Ici, le quart de cercle coupe le rectangle le long des bords supérieur et inférieur.bda

Région 3 (bleu): . Le quart de cercle coupe le rectangle le long des bords supérieur et droit.a<da2+b2

Voici une figure, où nous dessinons un exemple de rayon de chacun des trois types. Le rectangle est défini par , . La niveaux de gris dans le rectangle montre la densité où les zones sombres ont une densité plus élevée et les zones plus claires ont une densité plus faible. Cliquez sur la figure pour en ouvrir une version agrandie.a=5b=4fa(z1)fb(z2)dz1dz2

Distribution induite: intersections

Un peu de calcul laid

Pour calculer les probabilités, nous devons faire du calcul. Examinons tour à tour chacune des régions et nous verrons qu'une intégrale commune se formera. Cette intégrale a une forme fermée, bien qu'elle ne soit pas très jolie.

Région 1 : .0d<b

P(Dd)=0d0d2y2fb(y)fa(x)dxdy=0dfb(y)0d2y2fa(x)dxdy.

Maintenant, l'intégrale intérieure donne . Il nous reste donc à calculer une intégrale de la forme où dans ce cas de intérêt . L'antériorité de l'intégrale est 1a2d2y2(2ad2y2)

G(c)G(0)=0c(by)d2y2(2ad2y2)dy,
c=d
G(y)=(by)d2y2(2ad2y2)dy=a3d2y2(y(3b2y)+2d2)+abd2tan1(yd2y2)bd2y+by33+(dy)22y44.

On en déduit que .P(Dd)=2a2b2(G(d)G(0))

Région 2 : .bda

P(Dd)=2a2b2(G(b)G(0)),
selon le même raisonnement que pour la Région 1, sauf que maintenant nous devons intégrer le long de l' axe jusqu'à au lieu de simplement .ybd

Région 3 : . a<da2+b2

P(Dd)=0d2a2fb(y)dy+d2a2bfb(y)0d2y2fa(x)dxdy=Fb(d2a2)+2a2b2(G(b)G(d2a2))

Ci-dessous est une simulation de 20000 points où nous traçons la distribution empirique sous forme de points gris et la distribution théorique sous forme de ligne, colorée en fonction de la région particulière qui s'applique.

Cdf empirique et théorique

À partir de la même simulation, nous traçons ci-dessous les 100 premières paires de points et dessinons des lignes entre eux. Chacun est coloré en fonction de la distance entre la paire de points et dans quelle région cette distance se situe.

Échantillon aléatoire de points

Le nombre attendu de paires de points dans la distance est simplement par linéarité de l'espérance.d

E[ξ]=(n2)P(Dd),
cardinal
la source
3
+1. Bon travail! Ce serait merveilleux de voir la réponse exprimée en termes de propriétés géométriques intrinsèques du rectangle: cela devrait dépendre de choses comme sa superficie, son périmètre et la configuration des quatre angles. (La littérature - que j'ai vue référencée mais à laquelle je n'ai pas eu accès - semble se concentrer sur des domaines avec des frontières lisses.)
whuber
Merci. Voilà une excellente suggestion. Je vais essayer de faire de telles simplifications et reformulations.
Cardinal
@cardinal Très beau travail! J'ai été surpris que vous ayez bien répondu au problème, même avec le cdf détaillé. Merci.
zhouzhuojie
0

Si les points sont vraiment uniformément distribués, c'est-à-dire dans un motif connu fixe, alors pour n'importe quelle distance d, vous pouvez simplement boucler sur toutes les paires et compter celles à l'intérieur de la distance. Votre probabilité est (ce nombre / n).

Si vous avez la liberté supplémentaire de choisir comment les n points sont distribués / sélectionnés, alors c'est la version rectangulaire du paradoxe de Bertrand . Cette page montre un certain nombre de façons de répondre à cette question en fonction de la façon dont vous distribuez vos points.

cape1232
la source
La question porte sur la distribution des points iid uniformément distribués: ce sont des variables aléatoires, pas un "motif connu fixe", et on ne peut pas simplement boucler sur des paires d'entre elles!
whuber
Je pense que vous avez peut-être mal compris la question du PO. De plus, la distribution souhaitée est définie sans ambiguïté dans la question. Mon commentaire à l'OP laisse entendre qu'il existe déjà une solution sur le réseau SE à cette question, donc celle-ci peut très probablement être fermée. :)
cardinal
Êtes-vous sûr qu'il existe une solution sur math.SE, cardinal? Il s'agit d'un problème difficile en raison des effets de bord. Il y a peut-être une solution sur le tore plat.
whuber
@whuber: Une solution? Non, mais je suis presque certain que cette question apparaît. :) Je vais voir si je peux le trouver. En tout cas, je ne suis pas sûr que ce problème soit si difficile, même dans ce cas. Je pense que vous pouvez utiliser l'invariance de traduction pour simplifier quelque peu. Mais, je n'ai pas travaillé sur les détails.
Cardinal
1
@cardinal Merci. En fait, j'ai parcouru toutes les questions sur Math.SE, mais je ne pouvais toujours pas en trouver près de ce problème.
zhouzhuojie