Est-il possible d'estimer les chances de gagner un concours à entrées multiples, lorsque je ne connais pas la répartition des entrées?

8

Supposons que je participe à un concours , avec les règles suivantes:

  • Chaque personne peut obtenir jusqu'à 6 entrées
  • Toutes les candidatures seront regroupées et 25% des candidatures seront sélectionnées pour être gagnantes, avec un maximum de 25.
  • Chaque personne ne peut gagner qu'une seule fois, quel que soit le nombre de ses entrées. Si le nom de quelqu'un est à nouveau dessiné, il est rejeté et un nouveau nom est tiré.
  • Je sais combien d'entrées j'ai (le maximum, 6)
  • Je sais combien il y a d'entrées au total, ventilées par type d'entrée
  • Je ne sais pas combien des entrées sont des entrées répétées par la même personne.

Le nombre d'entrées par type est le suivant:

Type 1: 42 Type 2: 72 Type 3: 119 Type 4: 217 Type 5: 156 Type 6: 178

Est-il possible d'estimer mes chances de gagner dans cette situation? Je suis un peu confus par le fait que je ne peux pas prédire comment les premiers gagnants affecteront mes chances, car je ne sais pas combien d'inscriptions chaque gagnant supprimera de la piscine.

Je suis intéressé par la solution compte tenu de l'ensemble de données, mais je suis également intéressé par la procédure / l'algorithme approprié pour le calculer.

agent86
la source
Que signifient les "types"?
Macro
@Marco Les différents types de billets que vous pouvez gagner. Vous pouvez donc gagner des billets de loterie de 1 à 6, et 42 personnes ont gagné le type de billet 1
Rachel
J'ai du mal à suivre la séquence des messages car ils vont de bas en haut. Mais étant donné le temps à droite du nom des affiches, je pense que je l'ai compris. Alors, quelqu'un pourrait-il me dire si je comprends bien. Je pense que la réponse de whuber ne peut pas être correcte en raison de l'ambiguïté entre les entrées et les participants. La stratégie de Rachel pour obtenir le pire des cas et les meilleurs scénarios est la bonne, mais elle a fait une erreur mathématique en ajoutant des pourcentages lorsqu'ils peuvent être basés sur différents dénominateurs. Donc, si nous corrigeons cette erreur, nous avons les bonnes limites sur la solution.
Michael R. Chernick
J'ai pensé qu'il était étrange pour Rachel de se référer au meilleur scénario comme celui qui a donné le pourcentage de victoires le plus élevé et le pire cas celui qui a donné le plus bas. Gagner, c'est bien, non? Dernier point que j'aimerais clarifier: Cardinal déclare que dans ce cas, 25% des participants dépassent 25, il n'y aura donc que 25 gagnants. Il obtient cela en sachant qu'au moins 178 personnes sont inscrites et bien sûr, une fois que le nombre de participants dépasse 100, le total des gagnants est coupé à 25 selon les règles.
Michael R. Chernick
@cardinal comment avez-vous trouvé le numéro 178? J'ai ajouté toutes les entrées par types pour obtenir un total de 784. Dans le pire des cas, en tant que joueur, tout le monde a obtenu 6 entrées et 784/6 = 130,7. Je conclus donc qu'il doit y avoir au moins 130 entrées. Cela signifie toujours que le seuil de 25 s'applique, mais comment êtes-vous arrivé au chiffre le plus élevé?
Michael R. Chernick

Réponses:

6

Les chances possibles se situent entre 17,7% et 18,7%.

Le pire des cas se produit lorsque tout le monde mais vous avez exactement une entrée à la loterie: c'est une configuration cohérente avec les données (bien que peu probable!).

Comptons le nombre de possibilités dans lesquelles vous ne gagnez pas . Ceci est le nombre de façons de dessiner25 billets hors du 7846tickets restants, donnés par le coefficient binomial . (C'est un nombre énorme). Le nombre total de possibilités - toutes également probables dans un dessin équitable - est . Le ratio se simplifie à , soit environ 82,22772%: vos chances de ne pas gagner. Vos chances de gagner dans cette situation sont donc égales à 1 - 82,22772% = 17,7228% .(784625)(78425)(78425)(78430)/[(784)(7845)]

Le meilleur cas se produit quand il y a aussi peu de personnes impliquées dans la loterie que possible et autant que possible ont , puis , etc, billets. Étant donné que le nombre de "gemmes" est (dans l'ordre croissant), cela implique65(42,72,119,156,178,217)

  • Au maximum, personnes peuvent avoir entrées chacune.42=a66

  • Au plus personnes peuvent avoir entrées chacune.7242=30=a55

    ...

  • Au plus personnes peuvent avoir entrées chacune.178156=22=a22

  • 217178=39=a1 personnes ont entrée chacune.1

Soit la chance de gagner lorsque vous détenez (entre et ) billets dans une loterie avec des données et nuls. Le nombre total de tickets est donc égal à . Considérez le prochain tirage. Il y a sept possibilités:p(a,l,j)j16a=(a1,a2,,a6)l=251a1+2a2++6a6=n

  1. Un de vos billets est tiré; Vous gagnez. La chance de ceci est égale à .j/n

  2. Les billets de quelqu'un d'autre sont tirés. La chance de ceci est égale à . S'ils en détiennent , tous les billets sont retirés de la loterie. Si , le dessin continue avec les nouvelles données: a été diminué de et a également été diminué de . La chance qu'une personne avec billets à la loterie soit choisie, étant donné que la vôtre ne l'est pas, est égale à . Cela donne six possibilités disjointes pour .(nj)/niil1l1ai1iiai/(nj)i=1,2,,6

Nous ajoutons ces chances car elles partagent tous les résultats sans chevauchement.

Le calcul se poursuit récursivement dans cet arbre de probabilité jusqu'à ce que toutes les feuilles à soient atteintes. C'est beaucoup de calculs (environ = 244 millions de calculs), mais cela ne prend que quelques minutes (ou moins, selon la plateforme). J'obtiens 18.6475% des chances de gagner dans ce cas.l=0256

Voici le code Mathematica que j'ai utilisé. (Il est écrit en parallèle avec l'analyse précédente; il pourrait être rendu un peu plus efficace grâce à des réductions algébriques et des tests pour quand est réduit à ) Ici, l'argument ne compte pas les tickets que vous détenez: il donne la distribution du nombre de billets que tout le monde détient.ai0aj

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

Pour vérifier la réalité, comparons ces réponses à deux approximations naïves (dont aucune n'est tout à fait correcte):

  1. 25 tirages avec 6 billets en jeu devraient vous donner environ 6 * 25 sur 784 chances de gagner. C'est 19,1%.

  2. Chaque fois que votre chance de ne pas gagner est d'environ (784-6) / 784. Augmentez ce nombre au 25e pouvoir pour trouver votre chance de ne pas gagner à la loterie. La soustraire de 1 donne 17,5%.

On dirait que nous sommes dans le bon stade.

whuber
la source
1
J'aime ce problème car il fournit un véritable exemple de deux types d'incertitude: l'incertitude probabiliste dans la loterie et le manque de connaissances sur la véritable répartition de la propriété des billets au sein de la loterie. J'ai traité efficacement cette dernière incertitude en utilisant une analyse par intervalles, qui tente simplement de délimiter les possibilités aussi étroitement que possible. D'autres pourraient aller de l'avant et adopter une distribution préalable pour décrire cette incertitude épistémique, mais je ne peux concevoir aucun moyen valable de justifier une telle priorité compte tenu des informations à portée de main.
whuber
Mais vous supposez que personne ne peut avoir 2 ou plus d'un ticket de type particulier ("gem"). Autant que je puisse voir, cela n'est pas spécifié dans la description OP (agent86s) du problème.
Michael R. Chernick
@Michael Vous avez raison, ce n'est pas parfaitement clair dans les règles du jeu, bien qu'il soit fortement sous-entendu que personne ne collecte plus d'un de chaque type de gemme. Voir la règle 1 dans la question d'origine: "chaque personne peut obtenir jusqu'à 6 entrées."
whuber
1
Pour autant que je sache (et cela a été démontré pendant le concours), l'hypothèse à partir des informations fournies est correcte - personne ne peut avoir plus de 6 entrées, une de chaque "type".
agent86
1
Merci beaucoup d'avoir pris le temps de répondre à cela! Je pense à ce problème depuis hier, et je me suis réveillé ce matin, déterminé à comprendre si cela me tuait, et je suis heureuse de voir une excellente explication déjà publiée alors maintenant je n'ai pas à le faire :)
Rachel
1

Si j'ai bien fait les calculs, vous avez entre 19.43%et une 21.15%chance de gagner un prix

C'est 19.43%le meilleur des cas, où chaque participant a 6 billets

C'est 21.15%le pire des cas, où chaque participant a 1 billet sauf vous

Les deux scénarios sont extrêmement improbables, donc vos chances réelles de gagner se situent probablement quelque part entre les deux, mais une chance sur 1/5 de gagner semble être un chiffre assez solide.

Les détails sur la façon dont ces chiffres ont été obtenus peuvent être trouvés dans cette feuille de calcul Google , mais pour résumer comment ils ont été obtenus:

  1. Commencez avec le nombre total d'entrées (784) et vos entrées (6)
  2. Courez la chance de gagner ( 6 / 784 = 0.77%)
  3. Soustrayez 6 pour le meilleur des cas ou 1 pour le pire des cas de TotalEntries
  4. Courez la chance de gagner ( 6/778dans le meilleur des cas 6/783dans le pire des cas)
  5. Répétez les étapes 3-4 jusqu'à ce que vous ayez 25 pourcentages
  6. Additionnez les 25 pourcentages ensemble pour découvrir votre chance globale de gagner quelque chose

Voici une autre façon d'obtenir le pourcentage approximatif qui est plus simple, mais qui n'est pas aussi précis, car vous ne supprimez pas les doublons à chaque fois que vous dessinez un gagnant.

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

EDIT: Je suis presque sûr que je manque quelque chose dans mes calculs et que vous ne pouvez pas simplement ajouter des pourcentages comme celui-ci (ou multiplier le pourcentage de chances de gagner par # de prix), bien que je pense que je suis proche

Le commentaire de Whobar donne 17,4% de chances de gagner, même si je dois encore comprendre la formule qu'il a donnée et m'assurer qu'elle est exacte pour le concours. Peut-être un projet de week-end :)

Rachel
la source
Je vais juste souligner que cela suppose que vous avez 6 gemmes.
murgatroid99
@ murgatroid99 Oui, la question posée I know how many entries I have (the maximum, 6):) Je peux rendre la feuille de calcul modifiable par tous ceux qui veulent comprendre leurs chances de gagner
Rachel
2
Je pense que ces chiffres sont globalement corrects, mais sont en baisse de quelques pour cent. C'est difficile à dire car une description du calcul que vous avez fait n'a pas été fournie dans le message lui-même.
cardinal
1
D'après votre description, il semble que l'écart découle probablement du fait que vous n'avez pas incorporé la probabilité d'arriver à la ème étape avant d'être choisi. Par exemple, dans le pire des cas, la probabilité d'être sélectionné au troisième tirage est . k(7787776)/(784783782)
cardinal
2
Rachel, donne la chance qu'une personne avec tickets parmi aura au moins un d'entre eux choisi quand 25 seront tiré. (Il est basé sur le nombre de façons dont les billets d'une personne n'ont pas pu être tirés, en divisant par le nombre total de tirages possibles et en soustrayant ce ratio de ) Pour la valeur est de 17,7%. Je ne sais pas si c'est ainsi que la loterie est censée être gérée. 1(n625)(n25)6n1n=784
whuber