La valeur attendue de la variable aléatoire sur les lancers d'une pièce

8

Je suis tombé sur un problème intéressant aujourd'hui. On vous donne une pièce et x de l'argent, vous doublez de l'argent si vous obtenez des têtes et perdez la moitié si des queues sur n'importe quel lancer.

Quelle est la valeur attendue de votre argent en n essais
Quelle est la probabilité d'obtenir plus que la valeur attendue en (1)

C'est ainsi que je l'ai abordé. La probabilité de têtes et de queues est la même (1/2). Valeur attendue après le premier tirage = La valeur attendue est donc après le premier tirage. Répétition similaire du deuxième tirage sur 5x / 4, valeur attendue après le deuxième tirage = $1/2(2*x) + 1/2(1/2*x) = 5x/4$ $5x/4$ $1/2(2*5x/4) + 1/2(1/2*5x/4) = 25x/16$

Vous obtenez donc une séquence de valeurs attendues: , , , ... $5x/4$ $25x/16$ $125x/64$

Après essais, votre valeur attendue devrait être . $n$ $(5^n/4^n) * x$

Si est suffisamment grand, votre valeur attendue doit approcher la moyenne de la distribution. La probabilité que la valeur soit supérieure à la valeur attendue devrait donc être de . Je ne suis pas sûr de celui-ci. $n$ $0.5$

probability stochastic-processes user862
la source

1

La probabilité d'observer une valeur supérieure à la médiane est de moitié, mais votre quantité est log-normalement distribuée pour un grand n, qui a une moyenne et une médiane différentes, vous ne devez donc pas vous attendre à ce que cette probabilité approche de 1/2.

Yaroslav Bulatov

9

Si n est suffisamment grand, votre valeur attendue doit approcher la moyenne de la distribution.

Oui c'est correct.

La probabilité que la valeur soit supérieure à la valeur attendue devrait donc être de 0,5.

Cela ne serait correct que si la distribution est symétrique - ce qui n'est pas le cas dans votre jeu. Vous pouvez le voir facilement si vous pensez à la valeur médiane de vos gains après lancers. $n$

Vous pouvez considérer votre problème comme une marche aléatoire . Une marche aléatoire unidimensionnelle de base est une marche sur la ligne réelle entière, où à chaque point nous nous déplaçons avec une probabilité . C'est exactement ce que vous avez si nous ignorons le doublement / la réduction de moitié de l'argent et fixons . Tout ce que nous avons à faire est de remapper votre système de coordonnées sur cet exemple. Soit votre premier pot de départ. Ensuite, nous remappons de la manière suivante: $\pm 1$ $p$ $p=0.5$ $x$

x*2^{-2} = -2
x*2^{-1} = -1 
  x = 0
 x*2 = 1

soit . Soit le montant d'argent que nous avons gagné grâce au jeu après tours, puis $2^k x=k$ $S_n$ $n$

P r (S_{n} = 2^{k} x) = 2^{- n} (\binom{n}{(n + k) / 2})

$\begin{equation} Pr(S_n = 2^k x) = 2^{-n} \binom{n}{(n+k)/2} \end{equation}$ pour .

n \geq (n + k) / 2 \geq 0

$n \ge (n+k)/2 \ge 0$

Lorsque n'est pas un multiple de 2, alors . Pour comprendre cela, supposons que nous commençons avec 10 £. Après tours, les seules valeurs possibles sont £ 5 ou £ 20, c'est-à-dire ou . $(n+k)$ $Pr(S_n)=0$ $n=1$ $k=-1$ $k=1$

Le résultat ci-dessus est un résultat standard des marches aléatoires. Google marche au hasard pour plus d'informations. Également à partir de la théorie de la marche aléatoire, nous pouvons calculer le retour médian à , ce qui n'est pas la même chose que la valeur attendue. $x$

Remarque: j'ai supposé que vous pouvez toujours la moitié de votre argent. Par exemple, 1 pence, 0,5 pence, 0,25 pence sont tous autorisés. Si vous supprimez cette hypothèse, vous avez alors une marche aléatoire avec un mur absorbant.

Pour être complet

Voici une simulation rapide en R de votre processus:

#Simulate 10 throws with a starting amount of x=money=10
#n=10
simulate = function(){
  #money won/lost in a single game
  money = 10
  for(i in 1:10){
    if(runif(1) < 0.5)
      money = money/2
    else
      money = 2*money
  }
  return(money)
}

#The Money vector keeps track of all the games
#N is the number of games we play
N = 1000
Money = numeric(N)
for(i in 1:N)
  Money[i]= simulate()

mean(Money);median(Money)
#Probabilities
#Simulated
table(Money)/1000
#Exact
2^{-10}*choose(10,10/2)

#Plot the simulations
plot(Money)

csgillespie
la source

Parce que (n + k) / 2 n'est pas nécessairement entier, envisagez de réécrire la probabilité comme Pr (S_n = 2 ^ {2k-n}) = 2 ^ -n Comb (n, k), 0 <= k <= n. (Il y a aussi quelque chose de louche dans votre égalisation 2 ^ kx = k.)

whuber

votre variable devrait-elle moneyêtre x?

Jeromy Anglim

@ Jeromy: Oui, je l'ai changé. @whuber: Vous avez raison, j'ai essayé de rendre la probabilité un peu plus claire. BTW, intégral-> entier dans votre commentaire.

csgillespie

1

Soit la richesse après de ce jeu, où nous supposons La tentation ici est de prendre , et d'étudier comme une marche aléatoire symétrique, avec des innovations de taille . Il s'avère que ce sera bien pour la deuxième question, mais pas la première. Un peu de travail montrera que, asymptotiquement, nous avons . De là, vous ne pouvez pas conclure que est un journal asymptotiquement distribué normalement avec $S_k$ $k$ $S_0 = 1.$ $X_k = \log{S_k}$ $X_k$ $\pm \log{2}$ $X_k \sim \mathcal{N}(0,k(\log{2})^2)$ $S_k$ $\mu = 0, \sigma = \log{2}\sqrt{k}.$ L'opération de journalisation ne commute pas avec la limite. Si c'était le cas, vous obtiendriez la valeur attendue de sous la forme , ce qui est presque correct, mais pas tout à fait. $S_k$ $\exp{(k \log{2}\log{2}/2)}$

Cependant, cette méthode est très bien pour trouver des quantiles de , et d'autres questions de probabilité, comme la question (2). Nous avonsLa quantité du côté gauche de la dernière inégalité est, asymptotiquement, une normale standard, et donc la probabilité que dépasse sa moyenne s'approche de où est le CDF de la normale standard. Cela approche de zéro assez rapidement. $S_k$ $S_k \ge (\frac{5}{4})^k \Leftrightarrow X_k \ge k \log{(5/4)} \Leftrightarrow X_k / \sqrt{k}\log{2} \ge \sqrt{k}\log{(5/4})/\log{2}.$ $S_k$ $1 - \Phi{(\sqrt{k}\log{(5/4)}/\log{2})},$ $\Phi$

Code Matlab pour vérifier cela:

top_k = 512;
nsamps = 8192;
innovs = log(2) * cumsum(sign(randn(top_k,nsamps)),1);
s_k = exp(innovs);
k_vals = (1:top_k)';
mean_v = (5/4) .^ k_vals;
exceed = bsxfun(@ge,s_k,mean_v);
prob_g = mean(double(exceed),2);

%theoretical value
%(can you believe matlab doesn't come with normal cdf function!?)
nrmcdf = @(x)((1 + erf(x / sqrt(2)))/2);
p_thry = 1 - nrmcdf(sqrt(k_vals) * log(5/4) / log(2));

loglog(k_vals,prob_g,'b-',k_vals,p_thry,'r-');
legend('empirical probability','theoretical probability');

le graphique produit: texte alternatif

shabbychef
la source

-1

Vous avez raison sur l'attente.

En fait, vous avez également la bonne réponse à la probabilité d'obtenir plus que votre mise d'origine, bien que ce ne soit pas la bonne preuve. Considérez, au lieu du montant brut que vous avez, son logarithme en base 2. Cela s'avère être le nombre de fois que vous avez doublé votre argent, moins le nombre de fois que vous l'avez divisé par deux. Il s'agit de la somme de variables aléatoires indépendantes, chacune égale à ou avec une probabilité . La probabilité que vous voulez est la probabilité que cela soit positif. Si est impair, alors par symétrie c'est exactement ; si est pair (appelez-le ) alors c'est $S_n$ $n$ $+1$ $-1$ $1/2$ $n$ $1/2$ $n$ $2k$ $1/2$ moins la moitié de la probabilité que . Mais , qui approche comme . $S_n = 0$ $P(S_{2k} = 0) = {2k \choose k}/2^{2k}$ $0$ $k \to \infty$

Michael Lugo
la source

Cette démonstration semble supposer que le montant d'argent attendu est nul, mais ce n'est pas le cas. En outre, vous semblez supposer que le net des doublons moins les coupures doit être non négatif, ce qui est également incorrect. Collectivement, ces erreurs donnent la limite correcte, mais c'est un accident.

whuber

La valeur attendue de la variable aléatoire sur les lancers d'une pièce

Réponses: