Un joueur reçoit un dé à six faces. Pour gagner, elle doit lancer un nombre supérieur à 4 (c'est-à-dire un 5 ou un 6). Si elle obtient un 4, elle doit recommencer. Quelles sont ses chances de gagner?
Je pense que la probabilité de gagner , peut être exprimée récursivement comme:
J'ai approché à en exécutant 1 million d'essais en Java, comme ceci:
import java.util.Random;
public class Dice {
public static void main(String[] args) {
int runs = 1000000000;
int wins = 0;
for (int i = 0; i < runs; i++) {
wins += playGame();
}
System.out.println(wins / (double)runs);
}
static Random r = new Random();
private static int playGame() {
int roll;
while ((roll = r.nextInt(6) + 1) == 4);
return (roll == 5 || roll == 6) ? 1 : 0;
}
}
Et je vois que l'on pourrait développer comme ceci:
Mais je ne sais pas comment résoudre ce type de relation de récurrence sans recourir à ce type d'approximation. C'est possible?
probability
tronbabylove
la source
la source
Réponses:
Il suffit de le résoudre en utilisant l'algèbre:
la source
Remarque: Il s'agit d'une réponse à la question initiale, plutôt que de la récurrence.
Si elle obtient un 4, cela ne compte pas, car le prochain lancer est indépendant. En d'autres termes, après avoir obtenu un 4, la situation est la même que lorsqu'elle a commencé. Vous pouvez donc ignorer les 4. Ensuite, les résultats qui pourraient être importants sont 1-3 et 5-6. Il y a 5 résultats distincts, dont 2 gagnants. La réponse est donc 2/5 = 0,4 = 40%.
la source
Les réponses de dsaxton ( /stats//a/232107/90759 ) et GeoMatt22 ( /stats//a/232107/90759 ) donnent les meilleures approches du problème. Un autre est de réaliser que votre expression
C'est vraiment une progression géométrique :
En général, nous avons
nous avons donc ici
Bien sûr, la façon de prouver la formule générale de la somme d'une progression géométrique consiste à utiliser une solution algébrique similaire à dsaxton.
la source
Toutes les réponses ci-dessus sont correctes, mais elles n'expliquent pas pourquoi elles sont correctes et pourquoi vous pouvez ignorer autant de détails et éviter d'avoir à résoudre une relation de récurrence compliquée.
La raison pour laquelle les autres réponses sont correctes est la propriété Strong Markov , qui pour une chaîne de Markov discrète est équivalente à la propriété Markov régulière. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property
Fondamentalement, l'idée est que la variable aléatoire
est un temps d'arrêt . https://en.wikipedia.org/wiki/Stopping_time Un temps d'arrêt est une variable aléatoire qui ne dépend d'aucune information future .
Vous pouvez en savoir plus sur les temps d'arrêt et la propriété Strong Markov dans la section 8.3 de (la 4e édition de) Théorie et exemples de probabilité de Durrett , p. 365.
la source
Une autre façon de voir le problème.
Appelons un «résultat réel» un 1,2,3,5 ou 6.
Quelle est la probabilité de gagner au premier lancer si vous obtenez un «vrai résultat»? 2/5
Quelle est la probabilité de gagner au deuxième lancer, si le deuxième lancer est la première fois que vous obtenez un «vrai résultat»? 2/5
Idem pour les troisième, quatrième.
Ainsi, vous pouvez diviser votre échantillon en échantillons (infinis) plus petits, et ces échantillons donnent tous la même probabilité.
la source