Dans Libre Office Calc, la rand()
fonction est disponible, qui choisit une valeur aléatoire entre 0 et 1 dans une distribution uniforme. Je suis un peu rouillé sur ma probabilité, alors quand j'ai vu le comportement suivant, j'ai été perplexe:
A
= 200x1 colonne de rand()^2
B
= 200x1 colonne de rand()*rand()
mean(A)
= 1/3
mean(B)
= 1/4
Pourquoi mean(A)
! = 1/4
?
expected-value
random-generation
uniform
Jefftopia
la source
la source
rand()
fonctionne comme d'autres opérateurs similaires, A est le même nombre aléatoire au carré et B est deux nombres aléatoires, multipliés.Rand()
aient été remplacés parInt(2*Rand())
: cela prend les valeurs et avec des probabilités égales. Il y a deux possibilités pour son carré et quatre possibilités pour le produit de deux valeurs (indépendantes): que se passe-t-il lorsque vous définissez leurs attentes? 1Réponses:
Il peut être utile de penser aux rectangles. Imaginez que vous ayez la chance d'obtenir des terres gratuitement. La taille du terrain sera déterminée par (a) une réalisation de la variable aléatoire ou (b) deux réalisations de la même variable aléatoire. Dans le premier cas (a), l'aire sera un carré dont la longueur du côté sera égale à la valeur échantillonnée. Dans le deuxième cas (b), les deux valeurs échantillonnées représenteront la largeur et la longueur d'un rectangle. Quelle alternative choisissez-vous?
Soit une réalisation d'une variable aléatoire positive.U
a) La valeur attendue d'une réalisation détermine l'aire du carré qui est égale à U 2 . En moyenne, la taille de la zone sera E [ U 2 ]U U2
b) S'il y a deux réalisations indépendantes et U 2 , l'aire sera U 1 ⋅ U 2 . En moyenne, la taille est égale à E [ U 1 ⋅ U 2 ] = E 2 [ U ] car les deux réalisations sont de la même distribution et indépendantes.U1 U2 U1⋅ U2
Lorsque nous calculons la différence entre la taille des zones a) et b), nous obtenons
Le terme ci-dessus est identique à qui est intrinsèquement supérieur ou égal à 0 .V a r[ U ] 0
Cela vaut pour le cas général.
Dans votre exemple, vous avez échantillonné à partir de la distribution uniforme . Par conséquent,U(0,1)
E2[U]=1
Avec on obtient E [ U 2 ] = 1E[U2]=Var[U]+E2[U]
Ces valeurs ont été dérivées analytiquement, mais elles correspondent à celles que vous avez obtenues avec le générateur de nombres aléatoires.
la source
Pour ne pas suggérer qu'il y a quelque chose qui manque dans l'excellente réponse de Sven, mais je voulais présenter une approche relativement élémentaire de la question.
Pensez à tracer les deux composants de chaque produit afin de voir que la distribution commune est très différente.
Notez que le produit a tendance à être grand (près de 1) lorsque les deux composants sont grands, ce qui se produit beaucoup plus facilement lorsque les deux composants sont parfaitement corrélés plutôt qu'indépendants.
Quelle différence!
Il peut être utile de tracer des contours d'iso-produits sur des graphiques comme ceux ci-dessus, c'est-à-dire des courbes où xy = constant pour des valeurs comme 0,5, 0,6, 0,7, 0,8, 0,9. Au fur et à mesure que vous augmentez les valeurs, la proportion de points au-dessus et à droite du contour diminue beaucoup plus rapidement pour le cas indépendant.
la source