Pourquoi la distribution de rand () ^ 2 est-elle différente de celle de rand () * rand ()?

15

Dans Libre Office Calc, la rand()fonction est disponible, qui choisit une valeur aléatoire entre 0 et 1 dans une distribution uniforme. Je suis un peu rouillé sur ma probabilité, alors quand j'ai vu le comportement suivant, j'ai été perplexe:

A = 200x1 colonne de rand()^2

B = 200x1 colonne de rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

Pourquoi mean(A)! = 1/4?

Jefftopia
la source
4
Parce que l'espérance du carré d'une variable aléatoire n'est pas égale au carré de son attente.
Michael M
3
Si rand()fonctionne comme d'autres opérateurs similaires, A est le même nombre aléatoire au carré et B est deux nombres aléatoires, multipliés.
Peter Flom - Réintègre Monica
Je comprends. Ce serait très utile si je pouvais voir les mathématiques expliquées ou liées à une ressource qui le fait.
Jefftopia
4
Simplifier la situation pourrait vous aider à voir le point. Supposons qu'ils Rand()aient été remplacés par Int(2*Rand()): cela prend les valeurs et avec des probabilités égales. Il y a deux possibilités pour son carré et quatre possibilités pour le produit de deux valeurs (indépendantes): que se passe-t-il lorsque vous définissez leurs attentes? 101
whuber

Réponses:

24

Il peut être utile de penser aux rectangles. Imaginez que vous ayez la chance d'obtenir des terres gratuitement. La taille du terrain sera déterminée par (a) une réalisation de la variable aléatoire ou (b) deux réalisations de la même variable aléatoire. Dans le premier cas (a), l'aire sera un carré dont la longueur du côté sera égale à la valeur échantillonnée. Dans le deuxième cas (b), les deux valeurs échantillonnées représenteront la largeur et la longueur d'un rectangle. Quelle alternative choisissez-vous?

Soit une réalisation d'une variable aléatoire positive.U

a) La valeur attendue d'une réalisation détermine l'aire du carré qui est égale à U 2 . En moyenne, la taille de la zone sera E [ U 2 ]UU2

E[U2]

b) S'il y a deux réalisations indépendantes et U 2 , l'aire sera U 1U 2 . En moyenne, la taille est égale à E [ U 1U 2 ] = E 2 [ U ] car les deux réalisations sont de la même distribution et indépendantes.U1U2U1U2

E[U1U2]=E2[U]

Lorsque nous calculons la différence entre la taille des zones a) et b), nous obtenons

E[U2]-E2[U]

Le terme ci-dessus est identique à qui est intrinsèquement supérieur ou égal à 0 .Vuner[U]0

Cela vaut pour le cas général.

Dans votre exemple, vous avez échantillonné à partir de la distribution uniforme . Par conséquent,U(0,1)

E2[U]=1

E[U]=12
Var[U]=1
E2[U]=14
Var[U]=112

Avec on obtient E [ U 2 ] = 1E[U2]=Var[U]+E2[U]

E[U2]=112+14=13

Ces valeurs ont été dérivées analytiquement, mais elles correspondent à celles que vous avez obtenues avec le générateur de nombres aléatoires.

Sven Hohenstein
la source
Pour un arbitraire et b , j'obtiens a 2 + a b + b 2aba2+ab+b23
John
C'est une utilisation intelligente de la variance. Et ici, j'étais sur le point de frapper les mathématiques directement.
Affine
Cela me semble logique. Tout dépend de la variance non négative. Je suis également curieux de savoir comment John a obtenu sa réponse.
Jefftopia
Fondamentalement, ils ont juste suivi ce que Sven a fait, mais les ont remplacés par les formules d'une distribution uniforme plus générale.
John
E[U2]E[U2]E[U2]E2[U]
10

Pour ne pas suggérer qu'il y a quelque chose qui manque dans l'excellente réponse de Sven, mais je voulais présenter une approche relativement élémentaire de la question.

Pensez à tracer les deux composants de chaque produit afin de voir que la distribution commune est très différente.

tracé de u1 vs u2 et u1 vs u1

Notez que le produit a tendance à être grand (près de 1) lorsque les deux composants sont grands, ce qui se produit beaucoup plus facilement lorsque les deux composants sont parfaitement corrélés plutôt qu'indépendants.

1ϵϵϵ/2U2U1×U2ϵ2/2

Quelle différence!

Il peut être utile de tracer des contours d'iso-produits sur des graphiques comme ceux ci-dessus, c'est-à-dire des courbes où xy = constant pour des valeurs comme 0,5, 0,6, 0,7, 0,8, 0,9. Au fur et à mesure que vous augmentez les valeurs, la proportion de points au-dessus et à droite du contour diminue beaucoup plus rapidement pour le cas indépendant.

Glen_b -Reinstate Monica
la source