Lancez un dé jusqu'à ce qu'il tombe sur un nombre autre que 4. Quelle est la probabilité que le résultat soit> 4?

20

Un joueur reçoit un dé à six faces. Pour gagner, elle doit lancer un nombre supérieur à 4 (c'est-à-dire un 5 ou un 6). Si elle obtient un 4, elle doit recommencer. Quelles sont ses chances de gagner?

Je pense que la probabilité de gagner , peut être exprimée récursivement comme:P(W)

P(W)=P(r=5r=6)+P(r=4)P(W)

J'ai approché P(W) à 0,3999 en exécutant 1 million d'essais en Java, comme ceci:

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

Et je vois que l'on pourrait développer P(W) comme ceci:

P(W)=13+16(13+16(13+16))...

Mais je ne sais pas comment résoudre ce type de relation de récurrence sans recourir à ce type d'approximation. C'est possible?

tronbabylove
la source
6
C'est beaucoup d'efforts pour établir la relation de récurrence. Vous avez de bonnes raisons de croire que la réponse est 0,4. C'est un indice fort qu'il existe une autre façon de penser au problème qui vous donne la réponse directement. Chercher. La réponse de Geomatt vous y amènera, ce qui vous aidera à comprendre ce qui se passe ici et même à simplifier les autres problèmes que vous rencontrez plus rapidement sans ce genre d'effort. Si un problème apparemment compliqué semble avoir une réponse simple, vous devriez toujours consacrer du temps à essayer de comprendre pourquoi. Paye d'énormes dividendes plus tard.
Joel
8
Une fois que vous vous rendez compte qu'en raison des probabilités égales des six résultats et de l'indépendance des rôles, il n'y a rien de spécial dans un résultat particulier de cette expérience, il est évident que les cinq résultats possibles sont également probables.
whuber
6
Je suis un peu déçu que personne n'ait encore mis en place la solution de chaîne de Markov absorbante :-) Math Stack Exchange a une noble tradition de la «solution excessive» qui semble rarement imprégner la validation croisée ...
Silverfish
2
Il est 2/5 de choisir l'un des dans donc votre simulation est probablement correcte. { 1 , 2 , 3 , 5 , 6 }{5,6}{1,2,3,5,6}
mathreadler
2
Ce post vs les réponses est ce que j'imagine que les scientifiques des données sont comme les statisticiens.
bdeonovic

Réponses:

47

Il suffit de le résoudre en utilisant l'algèbre:

P(W)=26+16P(W)56P(W)=26P(W)=25.
dsaxton
la source
2
Notez que ce calcul n'est valide que parce que la propriété Strong Markov est valable pour les chaînes de Markov discrètes.
Chill2Macht
Je ne me souviens pas de mes chaînes de Markov discrètes, mais, je dirais, à partir de simples calculs, que vous voulez dire que la relation de récurrence n'est valide qu'en raison de la propriété de Markov forte. Une fois la relation établie, nous résolvons simplement pour x.
josinalvo
Est-ce correct?
josinalvo
1
@josinalvo: Techniquement, la question est de savoir si P (W) des deux côtés de l'équation signifie la même chose. La propriété Strong Markov implique qu'ils le font. En l'absence de cette propriété, P (W) sur le côté gauche signifie "la chance de gagner avec ce jet" et 1/6 * P (W) sur la droite signifie "la chance de gagner après avoir roulé un 4".
MSalters
81

Remarque: Il s'agit d'une réponse à la question initiale, plutôt que de la récurrence.

Si elle obtient un 4, cela ne compte pas, car le prochain lancer est indépendant. En d'autres termes, après avoir obtenu un 4, la situation est la même que lorsqu'elle a commencé. Vous pouvez donc ignorer les 4. Ensuite, les résultats qui pourraient être importants sont 1-3 et 5-6. Il y a 5 résultats distincts, dont 2 gagnants. La réponse est donc 2/5 = 0,4 = 40%.

GeoMatt22
la source
8
Vous pouvez rendre cela un peu plus direct: "Considérez le premier lancer qui n'est pas un 4. Alors les résultats ..."
Joel
2
La plupart des gens roulent des yeux quand ils voient des tonnes de mathématiques, donc j'aime mieux celui-ci. Fondamentalement, vous supprimez 4 des résultats, c'est donc 1, 2, 3, 5, 6. Il devient évident que vous avez 40% de chances à ce moment-là.
Nelson
Je pensais cela à partir du titre, donc j'ai simplement survolé la question complète après avoir cliqué dessus. Sinon, je me serais probablement confondu et deviné!
GeoMatt22
1
@Nelson J'ai vu plus de gens dont les yeux roulent quand ils voient ce genre de raisonnement dans un problème de probabilité que de gens dont les yeux roulent quand ils voient . p=une+bp
JiK
Oui. La morale de l'histoire est la suivante: n'essayez pas de rendre un problème plus difficile qu'il ne devrait l'être.
Jay
14

Les réponses de dsaxton ( /stats//a/232107/90759 ) et GeoMatt22 ( /stats//a/232107/90759 ) donnent les meilleures approches du problème. Un autre est de réaliser que votre expression

P(W)=13+16(13+16())

C'est vraiment une progression géométrique :

13+1613+16213+

En général, nous avons

n=0a0qn=a01q

nous avons donc ici

P(W)=131-16=13:56=615=25.

Bien sûr, la façon de prouver la formule générale de la somme d'une progression géométrique consiste à utiliser une solution algébrique similaire à dsaxton.

Meni Rosenfeld
la source
@William, je ne pense pas que votre commentaire soit approprié pour plusieurs raisons. 1. Je n'ai jamais dit qu'il fallait pour cela des séries géométriques. 2. Les concepts que vous utilisez dans votre réponse sont des machines beaucoup plus lourdes, il est ironique de dire "vous n'avez pas besoin de séries géométriques! Vous avez juste besoin de la propriété Markov forte beaucoup plus avancée et sophistiquée". 3. Une solution simple et rigoureuse a déjà été fournie par dsaxton. Votre méthode est plus détournée et exagérée pour ce problème. 4. L'OP avait déjà une expression équivalente à une série géométrique, quelqu'un devait y répondre, peut-être aussi bien moi.
Meni Rosenfeld
1
@William: En fin de compte, votre propre réponse est fine, perspicace et un ajout utile à la collection de réponses à la question. Cela ne signifie pas que vous devriez aller à toutes les autres réponses et dire que la vôtre est tellement meilleure. Ils vont tous bien aussi. Tout ne doit pas être abordé de la manière la plus abstraite et la plus générale possible.
Meni Rosenfeld
Cela fait un moment que je n'étais pas en mathématiques, alors je m'excuse si ma réponse manquait de rigueur. (S'il vous plaît, ne me dites pas que cela repose sur l' axiome de choix , car ce serait humiliant!) :)
GeoMatt22
3

Toutes les réponses ci-dessus sont correctes, mais elles n'expliquent pas pourquoi elles sont correctes et pourquoi vous pouvez ignorer autant de détails et éviter d'avoir à résoudre une relation de récurrence compliquée.

La raison pour laquelle les autres réponses sont correctes est la propriété Strong Markov , qui pour une chaîne de Markov discrète est équivalente à la propriété Markov régulière. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

Fondamentalement, l'idée est que la variable aléatoire

τ: =(

est un temps d'arrêt . https://en.wikipedia.org/wiki/Stopping_time Un temps d'arrêt est une variable aléatoire qui ne dépend d'aucune information future .

nτ=nτ

τXτ

τ-1τXτ>4

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

τ=1

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25

Vous pouvez en savoir plus sur les temps d'arrêt et la propriété Strong Markov dans la section 8.3 de (la 4e édition de) Théorie et exemples de probabilité de Durrett , p. 365.

Chill2Macht
la source
Pour autant que je sache à partir de l'entrée du wiki, l'existence d'un temps d'arrêt est nécessaire mais pas suffisant pour dire qu'une série d'événements présente le SMP. Désolé si je manque une blague ou un aperçu profond, mais pourquoi ne pas simplement supposer que les rôles sont indépendants et continuer?
Jacob Raihle
@JacobRaihle "Propriété Markov forte, qui pour une chaîne de Markov discrète est équivalente à la propriété Markov régulière." Ce scénario constitue clairement une chaîne de Markov discrète. Les rouleaux sont indépendants, c'est pourquoi c'est une chaîne Markov discrète. Le problème est que l'événement "premier rouleau qui n'atterrit pas sur 4" n'est pas indépendant des rouleaux précédents, pour des raisons qui, espérons-le, sont évidentes.
Chill2Macht
Il est également clair que les rôles sont indépendants. Alors quel avantage supplémentaire le SMP offre-t-il?
Jacob Raihle
@JacobRaihle Même si la valeur des jets est indépendante, la valeur du dé la première fois qu'il atterrit sur une valeur non égale à 4 n'est PAS indépendante des valeurs sur lesquelles le dé a atterri lors des jets précédents.
Chill2Macht
Cela devrait l'être, car le roulement s'arrête dès que cela se produit. Il ne peut pas y avoir de jet non-4 qui n'est pas aussi le premier. Et même si ce n'était pas le cas, je ne sais pas quel type de relation vous proposez.
Jacob Raihle
1

Une autre façon de voir le problème.

Appelons un «résultat réel» un 1,2,3,5 ou 6.

Quelle est la probabilité de gagner au premier lancer si vous obtenez un «vrai résultat»? 2/5

Quelle est la probabilité de gagner au deuxième lancer, si le deuxième lancer est la première fois que vous obtenez un «vrai résultat»? 2/5

Idem pour les troisième, quatrième.

Ainsi, vous pouvez diviser votre échantillon en échantillons (infinis) plus petits, et ces échantillons donnent tous la même probabilité.

josinalvo
la source