Attente d'un produit de variables aléatoires dépendantes lorsque

18

Laissez et , . Quelle est l'attente de comme ?X1U[0,1]XiU[Xi1,1]i=2,3,...X1X2Xnn

utilisé par
la source
7
Une remarque pédante: censé signifier ? Alternativement, cela pourrait signifier un conditionnement uniquement sur , c'est-à-dire . Mais comme ce dernier ne spécifie pas complètement la distribution conjointe des s, il n'est pas immédiatement clair si l'attente est déterminée de manière unique. XiU[Xi1,1]XiX1,,Xi1U[Xi1,1]Xi1XiXi1U[Xi1,1]Xi
Juho Kokkala du
Je pense que théoriquement, il devrait être conditionné à tous les précédents jusqu'à . Cependant, étant donné nous pouvons obtenir la distribution de . Je ne suis donc pas tout à fait sûr de cela. XiXi1Xi1Xi
usedbywho
@JuhoKokkala Comme indiqué, peu importe si vous conditionnez les variables avant car elles ne changeraient pas le fait que est uniforme . La distribution de me semble parfaitement bien définie. Xi1Xi[Xi1,1](X1,,Xn)
dsaxton
@dsaxton Si nous supposons seulement et , it reste possible que et X_3 ne soient pas conditionnellement indépendants conditionnellement à X_2 . Ainsi, la distribution de (X_1, X_2, X_3) n'est pas bien définie. X1U(0,1)XjeXje-1U(Xje-1,1),je=2,3,...X1X3X2(X1,X2,X3)
Juho Kokkala
@JuhoKokkala Si je vous dis que X2=t , quelle est la distribution de X3 ? Si vous pouvez répondre à la question sans même penser à X1 , comment X1 et X_3 peuvent - ilsX3 être dépendants étant donné X2 ? Notez également que d'autres affiches n'ont eu aucun mal à simuler cette séquence.
dsaxton

Réponses:

12

La réponse est en effet ,1/e comme deviné dans les réponses précédentes basées sur des simulations et des approximations finies.

La solution est facilement trouvée en introduisant une séquence de fonctions . Bien que nous puissions procéder immédiatement à cette étape, cela peut sembler plutôt mystérieux. La première partie de cette solution explique comment faire cuire ces . La deuxième partie montre comment ils sont exploités pour trouver une équation fonctionnelle satisfaite par la fonction limite . La troisième partie présente les calculs (de routine) nécessaires pour résoudre cette équation fonctionnelle.Fn:[0,1][0,1]Fn(t)F(t)=limnFn(t)


1. Motivation

Nous pouvons y parvenir en appliquant certaines techniques mathématiques standard de résolution de problèmes. Dans ce cas, où une sorte d'opération est répétée à l' infini, la limite existera comme point fixe de cette opération. La clé est donc d'identifier l'opération.

La difficulté est que le passage de à semble compliqué. Il est plus simple de voir cette étape comme résultant de l' de aux variables plutôt que de l' de aux variables . Si nous devions considérer comme étant construits comme décrit dans la question - avec uniformément distribué sur , conditionnellement uniformément distribué sur , et ainsi de suite - puis en introduisantE [ X 1 X 2X n - 1 X n ] X 1 ( X 2 , , X n ) X n ( X 1 , X 2 , , X n - 1 ) ( X 2 , , X nE[X1X2Xn-1]E[X1X2Xn-1Xn]X1(X2,,Xn)Xn(X1,X2,,Xn-1)X 2 [ 0 , 1 ] X 3 [ X 2 , 1 ] X 1(X2,,Xn)X2[0,1]X3[X2,1]X1provoquera chacun de la suivante à diminuer par un facteur de vers la limite supérieure . Ce raisonnement conduit naturellement à la construction suivante.1 - X 1 1Xi1X11

À titre préliminaire, puisqu'il est un peu plus simple de réduire les nombres vers que vers , soit . Ainsi, est uniformément distribué dans et est uniformément distribué dans conditionnellement à pour tout Nous nous intéressons à deux choses:1 Y i = 1 - X i Y 1 [ 0 , 1 ] Y i + 1 [ 0 , Y i ] ( Y 1 , Y 2 , , Y i ) i = 1 , 2 , 3 , .01Yi=1XiY1[0,1]Ouije+1[0,Ouije](Oui1,Oui2,,Ouije)je=1,2,3,.

  1. La valeur limite de .E[X1X2Xn]=E[(1-Oui1)(1-Oui2)(1-Ouin)]

  2. Comment ces valeurs se comportent lors de la uniforme de tous les vers : c'est-à-dire en les mettant à l'échelle par un facteur commun , . 0 t 0 t 1Ouije0t0t1

À cette fin, définissez

Fn(t)=E[(1-tOui1)(1-tOui2)(1-tOuin)].

Clairement, chaque est défini et continu (infiniment différentiable, en fait) pour tout réel . Nous nous concentrerons sur leur comportement pour . t t [ 0 , 1 ]Fntt[0,1]


2. L'étape clé

Les éléments suivants sont évidents:

  1. Chaque est une fonction décroissante de façon monotone de à .[ 0 , 1 ] [ 0 , 1 ]Fn(t)[0,1][0,1]

  2. nFn(t)>Fn+1(t) pour tout .n

  3. nFn(0)=1 pour tout .n

  4. E(X1X2Xn)=Fn(1).

Cela implique que existe pour tous les et .t [ 0 , 1 ] f ( 0 ) = 1F(t)=limnFn(t)t[0,1]F(0)=1

Notez que, conditionnelle à , la variable est uniforme dans et les variables (conditionnelles à toutes les variables précédentes) sont uniformes dans : c'est-à-dire , satisfont précisément aux conditions remplies par . par conséquentY 2 / Y 1 [ 0 , 1 ] Y i + 1 / Y 1 [ 0 , Y i / Y 1 ] ( Y 2 / Y 1 , Y 3 / Y 1 , , Y n / Y 1 ) ( Y 1 , , Y n - 1 )Oui1Oui2/Oui1[0,1]Ouije+1/Oui1[0,Ouije/Oui1](Oui2/Oui1,Oui3/Oui1,,Ouin/Oui1)(Oui1,,Ouin-1)

Fn(t)=E[(1-tOui1)E[(1-tOui2)(1-tOuin)|Oui1]]=E[(1-tOui1)E[(1-tOui1Oui2Oui1)(1-tOui1OuinOui1)|Oui1]]=E[(1-tOui1)Fn-1(tOui1)].

C'est la relation récursive que nous recherchions.

Dans la limite il doit donc être le cas que pour uniformément distribué dans indépendamment de tous les ,Y [ 0 , 1 ] Y inOui[0,1]Ouije

f(t)=E[(1tY)f(tY)]=01(1ty)f(ty)dy=1t0t(1x)f(x)dx.

Autrement dit, doit être un point fixe de la fonction pour laquelleLfL

L[g](t)=1t0t(1x)g(x)dx.

3. Calcul de la solution

Effacez la fraction en multipliant les deux côtés par . Parce que le côté droit fait partie intégrante, nous pouvons le différencier par rapport à , donnantt t1/ttt

f(t)+tf(t)=(1t)f(t).

De manière équivalente, en soustrayant et en divisant les deux côtés par ,tf(t)t

f(t)=f(t)

pour . Nous pouvons étendre cela par continuité pour inclure . Avec la condition initiale (3) , la solution unique estt = 0 f ( 0 ) = 10<t1t=0f(0)=1

f(t)=et.

Par conséquent, par (4), l'espérance limite de est , QED. f ( 1 ) = e - 1 = 1 / eX1X2Xnf(1)=e1=1/e


Parce que Mathematica semble être un outil populaire pour étudier ce problème, voici du code Mathematica pour calculer et tracer pour les petits . Le tracé de affiche une convergence rapide vers (représenté par le graphique noir). n f 1 , f 2 , f 3 , f 4 e - tfnnf1,f2,f3,f4et

a = 0 <= t <= 1;
l[g_] := Function[{t}, (1/t) Integrate[(1 - x) g[x], {x, 0, t}, Assumptions -> a]];
f = Evaluate@Through[NestList[l, 1 - #/2 &, 3][t]]
Plot[f, {t,0,1}]

Figure

whuber
la source
3
(+1) Belle analyse.
Cardinal
Merci de partager cela avec nous. Il y a des gens vraiment brillants!
Felipe Gerard
4

Mise à jour

Je pense que c'est une valeur sûre que la réponse est . J'ai exécuté les intégrales pour la valeur attendue de à utilisant Mathematica et avec j'ai obtenun = 2 n = 1001/en=2n=100n=100

0.367879441171442321595523770161567628159853507344458757185018968311538556667710938369307469618599737077005261635286940285462842065735614

(à 100 décimales). L'inverse de cette valeur est

2.718281828459045235360287471351873636852026081893477137766637293458245150821149822195768231483133554

La différence avec cette réciproque et este

-7.88860905221011806482437200330334265831479532397772375613947042032873*10^-31

Je pense que c'est trop proche, oserais-je dire, pour être une coïncidence rationnelle.

Le code Mathematica suit:

Do[
 x = Table[ToExpression["x" <> ToString[i]], {i, n}];
 integrand = Expand[Simplify[(x[[n - 1]]/(1 - x[[n - 1]])) Integrate[x[[n]], {x[[n]], x[[n - 1]], 1}]]];
 Do[
   integrand = Expand[Simplify[x[[i - 1]] Integrate[integrand, {x[[i]], x[[i - 1]], 1}]/(1 - x[[i - 1]])]],
   {i, n - 1, 2, -1}]
  Print[{n, N[Integrate[integrand, {x1, 0, 1}], 100]}],
 {n, 2, 100}]

Fin de la mise à jour

Il s'agit plus d'un commentaire étendu que d'une réponse.

Si nous empruntons une voie de force brute en déterminant la valeur attendue pour plusieurs valeurs de , peut-être que quelqu'un reconnaîtra un modèle et pourra alors prendre une limite.n

Pour , nous avons la valeur attendue du produitn=5

μn=01x11x21x31x41x1x2x3x4x5(1x1)(1x2)(1x3)(1x4)dx5dx4dx3dx2dx1

qui est 96547/259200 ou environ 0,3724807098765432.

Si nous supprimons l'intégrale de 0 à 1, nous avons un polynôme en avec les résultats suivants pour à (et j'ai supprimé l'indice pour rendre les choses un peu plus faciles à lire): n = 1 n = 6X1n=1n=6

X

(x+x2)/2

(5x+5x2+2x3)/12

(28x+28X2+13X3+3X4)/72

(1631X+1631X2+791X3+231X4+36X5)/4320

(96547X+96547X2+47617X3+14997X4+3132X5+360X6)/259200

Si quelqu'un reconnaît la forme des coefficients entiers, alors peut-être une limite comme peut être déterminée (après avoir effectué l'intégration de 0 à 1 qui a été supprimée pour montrer le polynôme sous-jacent).n

JimB
la source
1/e est magnifiquement élégant! :)
wolfies
4

Bonne question. Juste un petit commentaire, je voudrais noter que:

  • Xn convergera rapidement vers 1, donc pour la vérification Monte Carlo, la définition de fera plus que faire l'affaire.n=1000

  • Si , alors par simulation de Monte Carlo, comme , .Zn=X1X2XnnE[Zn]0.367

  • Le diagramme suivant compare le pdf Monte Carlo simulé de à une distribution de fonction de puissance [c'est-à-dire un pdf bêta (a, 1)]]Zn

f(z)=aza1

... ici avec le paramètre :a=0.57


(source: tri.org.au )

où:

  • la courbe bleue indique le pdf «empirique» de Monte Carlo deZn
  • la courbe en pointillés rouges est un pdf PowerFunction.

L'ajustement semble assez bon.

Code

Voici 1 million de dessins pseudo-aléatoires du produit (disons avec ), ici en utilisant Mathematica :Znn=1000

data = Table[Times @@ NestList[RandomReal[{#, 1}] &, RandomReal[], 1000], {10^6}];

La moyenne de l'échantillon est:

 Mean[data]

0,367657

Wolfies
la source
pouvez-vous partager tout votre code? Ma solution diffère de la vôtre.
1
Le premier point, crucial, ne semble pas suffisamment justifié. Pourquoi pouvez-vous ignorer l'effet, disons, des prochaines valeurs de ? Malgré une convergence "rapide", leur effet cumulatif pourrait considérablement réduire les attentes. dix100Xn
whuber
1
Bon usage de la simulation ici. J'ai des questions similaires à celles de @whuber. Comment pouvons-nous être sûrs que la valeur converge vers 0,367 mais pas quelque chose de plus bas, ce qui est potentiellement possible si est plus grand? n
usedbywho
En réponse aux 2 commentaires ci-dessus: (a) La série converge très rapidement vers 1. Même en commençant avec une valeur initiale de , dans environ 60 itérations, sera numériquement indiscernable du numérique 1.0 vers un ordinateur . Donc, simuler avec est exagéré. (b) Dans le cadre du test de Monte Carlo, j'ai également vérifié la même simulation (avec 1 million d'exécutions) mais en utilisant plutôt que 1000, et les résultats étaient indiscernables. Ainsi, il semble peu probable que des valeurs plus grandes de fassent une différence perceptible: au-dessus de , est effectivement 1.0.XjeX1=0,1X60Xnn=1000n=5000nn=100Xn
wolfies
0

Purement intuitivement, et basé sur l'autre réponse de Rusty, je pense que la réponse devrait être quelque chose comme ceci:

n = 1:1000
x = (1 + (n^2 - 1)/(n^2)) / 2
prod(x)

Ce qui nous donne 0.3583668. Pour chaque , vous divisez la plage en deux, où commence à . C'est donc un produit de , etc.X(une,1)une01/2,(1+3/4)/2,(1+8/9)/2

Ce n'est que de l'intuition.


Le problème avec la réponse de Rusty est que U [1] est identique dans chaque simulation. Les simulations ne sont pas indépendantes. Une solution est simple. Déplacez la ligne avec U[1] = runif(1,0,1)à l'intérieur de la première boucle. Le résultat est:

set.seed(3)    #Just for reproducibility of my solution

n = 1000    #Number of random variables
S = 1000    #Number of Monte Carlo samples

Z = rep(NA,S)
U = rep(NA,n)

for(j in 1:S){
    U[1] = runif(1,0,1)
    for(i in 2:n){
        U[i] = runif(1,U[i-1],1)
    }
    Z[j] = prod(U)
}

mean(Z)

Cela donne 0.3545284.

Jessica
la source
1
Solution très simple! Je suppose que c'est vrai, il y a toujours un bug dans le code! Je vais prendre ma réponse.
1
Oui, c'est exactement ce à quoi je m'attendais, étant donné que vous branchez les valeurs attendues comme limites inférieures.
1
J'ai exécuté votre code avec et j'ai obtenu comme réponse. N'est-ce pas un peu bizarre, car s'il converge vers une valeur, plus de parcours ne nous rapprocheraient-ils pas de cette valeur? S=100000.3631297
usedbywho