Comment est

19

Que les coordonnées cartésiennes d'un point aléatoire soient sélectionnées st .X,y(x,y)U(10,10)×U(10,10)

Ainsi, le rayon, , n'est pas uniformément distribué comme le le pdf de .ρ=x2+y2ρ

Néanmoins, je m'attendrais à ce que soit presque uniforme, à l'exclusion des artefacts dus aux 4 restes sur les bords:θ=arctanyX

entrez la description de l'image ici

Voici les fonctions de densité de probabilité calculées de manière graphique de et : θρentrez la description de l'image ici

Maintenant, si je laisse être distribué st alors semble uniformément distribué:X,yx,yN(0,202)×N(0,202)θ

entrez la description de l'image ici

Pourquoi n'est pas uniforme lorsque et est uniforme lorsque ?θ(x,y)U(10,10)×U(10,10)x,yN(0,202)×N(0,202)

Le code Matlab que j'ai utilisé:

number_of_points = 100000;
rng('shuffle')

a = -10;
b = 10;
r = (b-a).*randn(2,number_of_points);
r = reshape(r, [2,number_of_points]);
I = eye(2);
e1 = I(:,1); e2 = I(:,2);
theta = inf*ones(1,number_of_points);
rho = inf*ones(1,number_of_points);

for i=1:length(r(1,:))
    x = r(:,i);
    [theta(i),rho(i)] = cart2pol(x(1),x(2));        
end

figure
M=3;N=1; bins = 360;
subplot(M,N,1); 
histogram(rad2deg(theta), bins)
title('Polar angle coordinate p.d.f');

subplot(M,N,2); 
histogram(rho, bins);
title('Polar radius coordinate p.d.f');

subplot(M,N,3); 
histogram(r(:));
title('The x-y cooridnates distrbution (p.d.f)');

La substitution de la 3ème ligne: r = (b-a).*randn(2,number_of_points);avec r = (b-a).*randn(2,number_of_points) +a ;changera la distribution de de normale à uniforme.(x,y)

0x90
la source
5
La question semble de plus en plus jolie à chaque édition et le titre de la question est plus clair et plus concis. Bravo @ 0x90.
Michael R. Chernick
3
+1. Il est intéressant de noter que la distribution normale est la seule qui mène à des angles uniformément distribués (c'est-à-dire à une distribution 2D symétrique en rotation), voir stats.stackexchange.com/a/255417/28666 .
amibe dit Réintégrer Monica le

Réponses:

13

Vous faites référence à une transformation d'une paire de variables indépendantes en représentation polaire ( R , θ ) (rayon et angle), puis vous regardez la distribution marginale de θ .(X,Y)(R,θ)θ

Je vais offrir une explication quelque peu intuitive (bien qu'une dérivation mathématique de la densité fasse essentiellement ce que je décris de manière informelle).

Notez que si vous mettez à l'échelle les deux variables, X et Y selon une échelle commune (par exemple, passez de U (-1,1) à U (-10,10) ou de N (0,1) à N (0,20) sur les deux variables en même temps) cela ne fait aucune différence dans la distribution de l'angle (cela n'affecte que l'échelle de la distribution du rayon). Examinons donc les cas unitaires.

Réfléchissez d'abord à ce qui se passe avec le boîtier uniforme. Notez que la distribution est uniforme sur le carré unitaire, de sorte que la densité de probabilité dans une région contenue dans est proportionnelle à l'aire de la région. Plus précisément, regardez la densité associée à un élément d'angle, d θ près de l'horizontale (près de l'angle θ = 0 ) et sur la diagonale (près de l'angle θ = π / 4 ):[1,1]2dθθ=0θ=π/4

entrez la description de l'image ici

Il est clair que l'élément de probabilité (c'est-à-dire l'aire) correspondant à un élément d'angle ( d θ ) est plus grand lorsque l'angle est proche de l'une des diagonales. En effet, pensez à inscrire un cercle à l'intérieur du carré; la zone couverte par un petit angle donné à l'intérieur du cercle est constante, puis la partie à l'extérieur du cercle se développe à mesure que nous approchons de la diagonale, où elle à son maximum.dfθdθ

Cela explique complètement le modèle que vous voyez dans les simulations.

En effet, nous pouvons voir que la densité doit être proportionnelle à la longueur du segment du centre du carré à son bord; une simple trigonométrie suffit pour en déduire la densité, puis il est facile de trouver la constante requise pour que la densité s'intègre à 1.

[Modifier: ajouté ce bit suivant pour discuter du rayon, car la question a changé depuis ma réponse d'origine.]

Notez que si nous avions une distribution uniforme sur le cercle unitaire (c'est-à-dire celui que nous avons inscrit dans le carré avant) alors la densité du rayon pour cela serait proportionnelle au rayon (considérons l'aire d'un petit élément annulaire de largeur au rayon r - c'est-à-dire entre r et r + d r - a une aire proportionnelle à r ). Ensuite, lorsque nous passons à l'extérieur du cercle, de nouvelles régions annulaires de plus grand rayon ne reçoivent des contributions de densité que de la partie du carré, de sorte que la densité diminue (initialement assez rapidement, puis plus lentement) entre 1 et drrrr+drr1 . (Encore une fois, des notions géométriques assez simples sont suffisantes pour obtenir la forme fonctionnelle de la densité si elle est nécessaire.)2


En revanche, si la distribution conjointe est symétrique en rotation par rapport à l'origine, alors l'élément de probabilité à un certain angle ne dépend pas de l'angle (c'est essentiellement une tautologie!). La distribution bivariée de deux Gaussiennes standard indépendantes est symétrique en rotation par rapport à l'origine:

entrez la description de l'image ici

(code pour cette image basé sur le code d'Elan Cohen ici mais il y a une belle alternative ici , et quelque chose entre les deux ici )

Par conséquent, le volume contenu dans un certain angle est le même pour chaque θ , de sorte que la densité associée à l'angle est uniforme sur [ 0 , 2 π ) .dθθ[0,2π)

[L'astuce polaire généralement utilisée pour intégrer la densité normale sur la ligne réelle peut être utilisée pour comprendre que la densité du rayon carré est exponentielle négative, et à partir de là, la densité du rayon est simple à identifier par un simple argument de transformation à partir de la fonction de distribution]

Glen_b -Reinstate Monica
la source
4
Les quatre pointes dans la distribution de sont en effet dues aux quatre coins du carré ( - 10 , 10 ) 2 . Notez que toute distribution sphérique symétrique conduira à la distribution uniforme sur θ , en commençant par les uniformes sur les sphères et les cercles centrés sur ( 0 , 0 ) . θ(10,10)2θ(0,0)
Xi'an
2
+1. Il est intéressant de noter que la distribution normale est la seule qui mène à une distribution 2D symétrique en rotation, voir stats.stackexchange.com/a/255417/28666 . Cela m'a surpris.
amibe dit Réintégrer Monica le
3
@amoeba Oui, c'est la seule distribution symétrique circulaire qui est le produit de marges indépendantes.
Glen_b -Reinstate Monica
2
Je pense que c'est assez étonnant. Pensez à le mentionner dans votre réponse!
amibe dit Réintégrer Monica le
6

Je répondrai à la question sur le cas normal conduisant à la distribution uniforme. Il est bien connu que si et Y sont indépendants et normalement distribués, les contours de densité de probabilité constante sont un cercle dans le plan x - y . Le rayon R = XYxy a ladistribution de Rayleigh. Pour une bonne discussion à ce sujet, l'article de Wikipédia intitulé Distribution Rayleigh.R=X2+Y2

Examinons maintenant les variables aléatoires et Y en utilisant les coordonnées polaires.XY

, Y = r sin ( θ ) . notons que X 2 + Y 2 = r 2 . Si θ est uniforme sur ( 0 , 2 π ) et r a une distribution de Rayleigh, X et Y seront des normales indépendantes ayant chacune unemoyenne de 0 et une variance commune. L'inverse est également vrai. La preuve de l'inverse est ce que je pense que le PO souhaite comme réponse à la deuxième partie de la question.X=rcos(θ)Y=rsin(θ)X2+Y2=r2θ(0,2π)rXY0

Voici un croquis de la preuve. Sans perte de généralité, nous pouvons supposer que est distribué N ( 0 , 1 ) et Y est distribué N ( 0 , 1 ) et indépendant les uns des autres.XN(0,1)YN(0,1)

Ensuite , le joint de densité . Utilisez la transformation en coordonnées polaires pour obtenir g ( r , θ ) . Puisque x = r sin ( θ ) et y = r cos ( θ ) . Alors rf(x,y)=(1/2π)exp[([x2+y2])/2]g(r,θ)x=rsin(θ)y=rcos(θ) etθ=arctan(x/y). Calculez le jacobien de la transformation et effectuez la substitution appropriée enf(x,y). par conséquentg(r,θ)serarexp[(-r2)/(2π)]pourr0et0θr=x2+y2θ=arctan(x/y)f(x,y)g(r,θ)rexp[(r2)/(2π)]r0 . Cela montre que r et thêta sont indépendants, r ayant une distribution de Rayleigh et thêta ayant la densité constante 1 / ( 2 π ) .0θ2πrr1/(2π)

Michael R. Chernick
la source
Cela signifie que si vous regardez la hauteur de la densité bivariée à une distance radiale fixe du centre (dans ce cas l'origine), ce sera la même valeur sur tous les points de ce cercle.
Michael R. Chernick
@ 0x90 Oui, votre lien montre une façon de voir cela est de regarder la forme quadratique dans l'exposant de la densité. Donc, en général, pour le paramètre normal bivarié, l'exposant à une constante définit les contours d'une densité constante et cette équation est celle d'une ellipse. dans le cas particulier où la matrice de covariance est un matirix d'identité à l'échelle, l'ellipse se simplifie en cercle.
Michael R. Chernick
2
Je pense qu'il existe un moyen plus simple de voir l'uniformité: pour une normale indépendante avec une moyenne de 0 , il est facile de montrer que leur rapport est Cauchy ( 0 , 1 ) . Étant donné que CDF de Cauchy est simplement une mise à l'échelle et une translation d' arctan , par probabilité, la transformée intégrale arctan ( X / Y ) est simplement une variable aléatoire uniforme standard décalée et mise à l'échelle. X,Y0Cauchy(0,1)arctan arctan(X/Y)
Francis
1
@Francis La plupart du temps, j'apprécie votre édition approfondie de toutes mes équations. Je tiens également à dire que votre commentaire ci-dessus montre certainement une approche imaginative pour résoudre le problème d'uniformité avec le thêta. Je suis sûr que certains conviendront que c'est plus facile.
Michael R. Chernick
6

Pour compléter les assez bonnes réponses données par Glen et Michael, je vais simplement calculer la densité de lorsque la distribution de ( X , Y ) est uniforme sur le carré [ - 1 , 1 ] × [ - 1 , 1 ] . Cette densité uniforme est de 1θ(X,Y)[1,1]×[1,1] sur ce carré,0ailleurs - c'est-à-dire que la probabilité d'échantillonnage d'un point dans une région donnée du carré est1140 région de cette région.14

La région d'intérêt pour notre question est le secteur rouge sur ce dessin: square with a shaded sector

θθ+dθθθ+dθθ

θ[π4,π4]π2

La trigonométrie élémentaire montre que le côté inférieur a une longueur 1cosθ. La taille supérieure a une longueur

1cos(θ+dθ)=1cosθ+sinθcos2θdθ.
(We’ll see that the precise value of the derivative doesn’t really matter here!)

Now the area of a triangle with two sides of lengthes a and b forming an angle α is 12absinα, hence in our case

12(1cosθ)(1cosθ+sinθcos2θdθ)sindθ=dθ2cos2θ
(we neglect higher powers of dθ and use sindθ=dθ).

Thus the density of θ is

18cos2θ
for θ in [π4,π4], and is π2 periodic.

Verification:

x <- runif(1e6, -1, 1)
y <- runif(1e6, -1, 1)
hist( atan2(y,x), freq=FALSE, breaks=100)
theta <- seq(-pi, pi, length=500)
lines(theta, 0.125/cos((theta + pi/4)%%(pi/2) - pi/4)**2, col="red" )

histogramm + density

Elvis
la source