Nombre prévu de doublons (triplets, etc.) lors du dessin avec remplacement

10

J'ai le problème suivant:

J'ai 100 articles uniques (n), et j'en sélectionne 43 (m) un à la fois (avec remplacement).

Je dois résoudre pour le nombre attendu d'uniques (sélectionné une seule fois, k = 1), doubles (sélectionnés exactement deux fois k = 2), tripples (exactement k = 3), quads etc ...

J'ai pu trouver plein de résultats sur la probabilité qu'il y ait au moins un double (paradoxe d'anniversaire), mais pas sur le nombre attendu de couples dans la population.

Kaitlyn K
la source
Une estimation de Monte Carlo vous serait-elle utile ou avez-vous besoin d'une réponse sous forme fermée?
David J. Harris
Je préférerais une formule sous forme fermée afin de pouvoir l'appliquer facilement à différentes valeurs de n, m et k.
Kaitlyn K

Réponses:

7

L' iterm sera sélectionné fois. De là, vous pouvez trouver toutes les quantités que vous voulez, car, par exemple, Par exemple, le nombre attendu de paires est donné par Binom ( m ,ithE [ nombre de paires ] = n i = 1 P [ i t h l'  élément apparaît deux fois ] n P [ Binom ( m ,Binom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Vous pouvez obtenir la valeur numérique dans R avec la commande n * dbinom (k, m, 1 / n).

Stefan Wager
la source
Cette formule peut-elle être utilisée pour ak = 0 ou 1?
Kaitlyn K du
Oui il peut. Avec k = 0, vous pouvez l'interpréter comme «combien de points n'apparaîtront pas parmi les m sélectionnés».
Stefan Wager
Mais ces événements ne sont pas indépendants. Par exemple, lorsque l'élément 1 apparaît m fois, aucun autre élément ne peut jamais apparaître. Vous ne pouvez pas simplement additionner les P.
asterix314