Voici la question:
Vous lancez un dé équitable à 6 faces de manière itérative jusqu'à ce que la somme des lancers de dés soit supérieure ou égale à M. Quelle est la moyenne et l'écart-type de la somme moins M lorsque M = 300?
Dois-je écrire un code pour répondre à ce genre de questions?
Veuillez me donner quelques indices à ce sujet. Merci!
[self-study]
balise et lire son wiki . Ensuite, dites-nous ce que vous comprenez jusqu'à présent, ce que vous avez essayé et où vous êtes coincé. Nous vous fournirons des conseils pour vous aider à vous décoller.Réponses:
Vous pouvez certainement utiliser du code, mais je ne simulerais pas.
Je vais ignorer la partie "moins M" (vous pouvez le faire assez facilement à la fin).
Vous pouvez calculer les probabilités de manière récursive très facilement, mais la réponse réelle (avec un très haut degré de précision) peut être calculée à partir d'un simple raisonnement.
Que les rouleaux soient . Soit .S t = ∑ t i = 1 X iX1,X2,... St=∑ti=1Xi
Que soit l'indice le plus petit où .S τ ≥ Mτ Sτ≥M
De même
Des équations similaires à la première ci-dessus pourraient alors (au moins en principe) être exécutées jusqu'à ce que vous atteigniez l'une des conditions initiales pour obtenir une relation algébrique entre les conditions initiales et les probabilités que nous voulons (ce qui serait fastidieux et pas particulièrement instructif) , ou vous pouvez construire les équations avancées correspondantes et les exécuter à partir des conditions initiales, ce qui est facile à faire numériquement (et c'est ainsi que j'ai vérifié ma réponse). Cependant, nous pouvons éviter tout cela.
Les probabilités des points sont des moyennes pondérées des probabilités précédentes; ceux-ci lisseront (géométriquement rapidement) toute variation de probabilité par rapport à la distribution initiale (toute probabilité au point zéro dans le cas de notre problème). le
Pour une approximation (très précise), nous pouvons dire que à M - 1 devraient être presque également probables au temps τ - 1 (très proche de lui), et ainsi de ce qui précède, nous pouvons écrire que les probabilités être très proche d'être dans des ratios simples, et comme ils doivent être normalisés, nous pouvons simplement écrire les probabilités.M−6 M−1 τ−1
Autrement dit, nous pouvons voir que si les probabilités de commencer de à M - 1 étaient exactement égales, il y a 6 façons tout aussi probables d'arriver à M , 5 d'arriver à M + 1 , et ainsi de suite jusqu'à 1 façon d'arriver à M + 5 .M−6 M−1 M M+1 M+5
Autrement dit, les probabilités sont dans le rapport 6: 5: 4: 3: 2: 1, et la somme de 1, donc elles sont triviales à noter.
Le calcul exact (jusqu'aux erreurs d'arrondi numériques cumulées) en exécutant les récursions de probabilité vers l'avant à partir de zéro (je l'ai fait dans R) donne des différences de l'ordre de≈
.Machine$double.eps
( sur ma machine) par rapport à l'approximation ci-dessus (c'est-à-dire simple le raisonnement suivant les lignes ci-dessus donne des réponses effectivement exactes , car elles sont aussi proches des réponses calculées à partir de la récursivité que nous nous attendrions à ce que les réponses exactes soient2.22e-16
Voici mon code pour cela (la plupart c'est juste l'initialisation des variables, le travail est tout en une seule ligne). Le code démarre après le premier lancer (pour éviter de mettre une cellule 0, ce qui est une petite nuisance à gérer dans R); à chaque étape, il prend la cellule la plus basse qui pourrait être occupée et avance d'un jet de dé (répartissant la probabilité de cette cellule sur les 6 cellules suivantes):
(nous pourrions utiliser
rollapply
(à partir dezoo
) pour le faire plus efficacement - ou un certain nombre d'autres fonctions de ce type - mais il sera plus facile à traduire si je le maintiens explicite)Notez qu'il
d6
s'agit d'une fonction de probabilité discrète sur 1 à 6, donc le code à l'intérieur de la boucle de la dernière ligne construit des moyennes pondérées courantes de valeurs antérieures. C'est cette relation qui adoucit les probabilités (jusqu'aux dernières valeurs qui nous intéressent).Voici donc les 50 premières valeurs impaires (les 25 premières valeurs marquées de cercles). À chaque , la valeur sur l'axe des y représente la probabilité qui s'est accumulée dans la cellule la plus en arrière avant de la faire avancer dans les 6 cellules suivantes.t
Comme vous le voyez, il se lisse (à , l'inverse de la moyenne du nombre de pas que vous lance chaque dé) assez rapidement et reste constant.1/μ
A partir de la distribution de probabilité, la moyenne et la variance des probabilités sont alors simples.
la source
Les valeurs initiales de cette séquence sont
Le calcul de la moyenne et de la variance de cette distribution est simple et facile.
R
la source