Nombre attendu de cartes invisibles lors du tirage de cartes d'un paquet de taille

10

Nous avons un jeu de cartes. Nous en tirons des cartes uniformément au hasard avec remplacement. Après tirages, quel est le nombre attendu de cartes jamais choisies?n2n

Cette question fait partie du problème 2.12 de

M. Mitzenmacher et E. Upfal, Probability and Computing: Randomized Algorithms and Probabilistic Analysis , Cambridge University Press, 2005.

De plus, pour ce que ça vaut, ce n'est pas un problème de devoirs. C'est l'auto-apprentissage et je suis juste coincé.

Jusqu'à présent, ma réponse est:

Soit le nombre de cartes distinctes vues après le ème tirage. Alors:Xii

E[Xi]=k=1nk(knP(Xi1=k)+nk1nP(Xi1=k1))

L'idée ici est qu'à chaque fois que nous tirons, nous tirons soit une carte que nous avons vue, soit une carte que nous n'avons pas vue, et que nous pouvons définir cela de manière récursive.

Enfin, la réponse à la question, combien n'avons-nous pas vu après tirages, sera .2nnE[X2n]

Je pense que c'est correct, mais qu'il doit y avoir une solution plus simple.

Toute aide serait grandement appréciée.

Craig Wright
la source
L'avez-vous simulé et comparé les résultats?
Adam

Réponses:

10

Astuce: à tout tirage, la probabilité qu'une carte ne soit pas choisie est . Et puisque nous dessinons avec remplacement, je suppose que nous pouvons dire que chaque tirage est indépendant des autres. Donc, la probabilité qu'une carte ne soit pas choisie en tirages est ...n1n2n


la source
3
(+1) Cela donne un bon premier départ. La combinaison de cela avec la linéarité des attentes conduit à une solution économique et élégante.
Cardinal
6

Merci Mike pour l'astuce.

C'est ce que j'ai trouvé.

Soit une variable aléatoire de Bernoulli où si la carte n'a jamais été tirée. Alors , mais comme est le même pour tout , soit .XiXi=1ithpi=P(Xi=1)=(n1n)2npiip=pi

Soit maintenant le nombre de cartes non tirées après tirages.X=i=1nXi2n

AlorsE[X]=E[i=1nXi]=i=1nE[Xi]=i=1np=np

Et c'est ce que je pense.

Craig Wright
la source
4
(+1) Notez également que pour grand, . npe2
Dilip Sarwate
C'est peut-être un peu plus compliqué que ça. La probabilité que la carte (i) soit manquée est celle que vous avez écrite. Cependant, une fois que nous savons que la carte (i) a été manquée, la probabilité de manquer la carte (j) change. Je ne sais pas si la question de l'indépendance changera le résultat final mais complique la dérivation.
Emil Friedman
@Emil Friedman: L'attente est linéaire, que les sommets soient indépendants ou non. Le manque d'indépendance affecte des quantités comme la variance, mais pas les attentes.
Douglas Zare
4

Voici du code R pour valider la théorie.

evCards <- function(n) 
{
    iter <- 10000;
    cards <- 1:n;
    result <- 0;
    for (i in 1:iter) {
        draws <- sample(cards,2*n,T);
        uniqueDraws <- unique(draws,F);
        noUnique <- length(uniqueDraws);
        noNotSeen <- n - noUnique;
        result <- result + noNotSeen;
    }
    simulAvg <- result/iter;
    theoryAvg <- n * ((n-1)/n)^(2*n);
    output <-list(simulAvg=simulAvg,theoryAvg=theoryAvg);
    return (output);
}
varty
la source