Comment trouver la distance attendue entre deux points uniformément répartis?

9

Si je devais définir les coordonnées et où( X 2 ,(X1,Oui1)(X2,Oui2)

X1,X2Unif(0,30) et Oui1,Oui2Unif(0,40).

Comment trouver la valeur attendue de la distance entre eux?

Je pensais, puisque la distance est calculée par serait la valeur attendue être juste ?(1/30+1/30)2+(1/40+1/40)2(X1-X2)2+(Oui1-Oui2)2)(1/30+1/30)2+(1/40+1/40)2

Mathlete
la source
Votre code LaTeX ne s'affichait pas correctement. J'espère que ma solution est celle que vous vouliez
Peter Flom
Presque, mais cela m'a finalement aidé à y arriver, merci beaucoup.
Mathlete
2
Question équivalente sur le site de mathématiques: Distance moyenne entre des points aléatoires dans un rectangle . Une question connexe: Probabilité que des points uniformément aléatoires dans un rectangle aient une distance euclidienne inférieure à un seuil donné . (Malheureusement, je n'ai jamais réussi à prendre @whuber sur ses suggestions là-bas. J'essaierai de trouver du temps pour le faire.)
Cardinal
1
Merci pour ces liens, @cardinal. Bien que la version mathématique n'explique pas la réponse - elle la présente simplement - elle contient des liens vers une dérivation, qui mérite d'être revue.
whuber

Réponses:

2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

Si je comprends bien ce que vous recherchez, cela peut peut-être vous aider. Vous essayez de comprendre la distance entre des points aléatoires, les valeurs X qui sont générées à partir d'unif (0,30) et les valeurs Y sont générées à partir d'un unif (0,40). Je viens de créer un million de RV à partir de chacune de ces distributions, puis j'ai lié les x et les y pour créer un point pour chacune d'entre elles. Ensuite, j'ai calculé la distance entre les points 2 et 1 jusqu'à la distance entre les points 1 000 000 et 999 999. La distance moyenne était de 18,35855. Faites-moi savoir si ce n'est pas ce que vous cherchiez.

Eric Peterson
la source
A pris la liberté de modifier pour le formatage.
curious_cat
2
Vous êtes venu assez près - peut-être par hasard. La vraie réponse est =18,345919. Votre code présente deux problèmes: (1) les itérations ne sont pas mutuellement indépendantes; et (2) pour obtenir une précision raisonnable, il devrait être codé pour être plus rapide. Pourquoi ne pas faire la simulation directement, comme dans. Cela vous donnera environ quatre chiffres significatifs (en moins de temps), comme vous pouvez le vérifier en calculant l'erreur standard. 1108(871+960Journal(2)+405Journal(3))18.345919n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)sd(distance) / sqrt(n)
whuber
@whuber: Pouvez-vous expliquer votre # 1? Par exemple, disons (cas I) J'ai tiré des paires de nombres aléatoires d'une distribution donnée et calculé les différences et pris une moyenne. Versus (cas II) J'ai continué à dessiner un nombre à la fois et j'ai continué à calculer les différences courantes par rapport au dernier tirage numérique, puis à faire la moyenne. La moyenne déclarée par les cas I et II serait-elle systématiquement différente?
curious_cat
1
@curious_cat Non, les moyennes seraient à peu près les mêmes: mais le calcul de l' erreur type serait différent. Nous avons besoin de ce calcul afin d'estimer à quel point la moyenne est susceptible d'atteindre la vraie valeur. Plutôt que de travailler sur le calcul SE le plus compliqué, il est plus simple de générer des paires de points complètement indépendamment les uns des autres, exactement comme stipulé dans la question. (Il y a tellement de façons dont une simulation peut mal tourner - je sais par expérience! - qu'il est sage de faire en sorte que la simulation imite la réalité aussi fidèlement que possible.)
whuber
@whuber: Merci d'avoir clarifié. Donc, si Clark avait exécuté son code plus longtemps, il aurait peut-être obtenu plus de décimales, n'est-ce pas?
curious_cat
16

Il est clair, en regardant la question géométriquement, que la distance attendue entre deux points aléatoires indépendants et uniformes dans un ensemble convexe va être un peu moins de la moitié de son diamètre . (Cela devrait être moins parce qu'il est relativement rare que les deux points soient situés dans des zones extrêmes comme les coins et le plus souvent, ils seront près du centre, où ils sont proches.) Puisque le diamètre de ce rectangle est de , par ce seul raisonnement, nous prévoyons que la réponse sera un peu moins de 25 .5025

Une réponse exacte est obtenue à partir de la définition de l'attente comme la valeur pondérée par la probabilité de la distance. En général, considérons un rectangle des côtés et λ ; nous escalader jusqu'à la taille correcte par la suite (par le réglage λ = 40 / 30 et en multipliant l'attente par 30 ). Pour ce rectangle, en utilisant les coordonnées ( x , y ) , la densité de probabilité uniforme est 11λλ=40/3030(x,y). La distance moyenne à l'intérieur de ce rectangle est alors donnée par1λdxdy

0λ010λ01(X1-X2)2+(y1-y2)21λX1y11λX2y2.

L'utilisation de méthodes d'intégration élémentaires est simple mais difficile à faire; J'ai utilisé un système d'algèbre informatique ( Mathematica ) pour obtenir la réponse

[2+2λ5-21+λ2+6λ21+λ2-2λ41+λ2+5λArcSinh(λ)+5λ4Journal(1+1+λ2λ)]/(30λ2).

La présence de 1+λ2303040

λ=4/3301108(871+960Journal(2)+405Journal(3))18.345919


1+λ2λ01λ1/λλλ=1

Terrain

1/30,330,373:1

whuber
la source
Cela devrait-il être "diagonal" au lieu de "diamètre"? Désolé si je taquine.
curious_cat
@curious_cat Par définition, le diamètre d'un ensemble de points (dans n'importe quel espace métrique) est le suprême des distances entre deux points quelconques. Pour un rectangle, c'est (évidemment) la longueur d'une diagonale.
whuber
Merci! Je ne me suis pas rendu compte. J'utilisais un concept naïf de diamètre.
curious_cat
En aparté: Pour tous les rectangles d'une aire donnée, la distance moyenne serait-elle minimisée pour un carré?
curious_cat
2
Dans l'esprit de ce , je souhaite que vous avez commencé cette réponse avec « Il est plane ... » (1)
cardinal