Considérons une urne contenant boules de couleurs différentes, étant la proportion de boules de couleur parmi les boules ( ). Je dessine boules de l'urne sans remplacement et regarde le nombre de couleurs différentes parmi les boules qui ont été tirées. Quelle est l'attente de en fonction de , selon les propriétés appropriées de la distribution ?P p i i N ∑ i p i = 1 n ≤ Nγ n / N p
Pour donner plus d'informations: si et pour tout , alors je verrai toujours exactement couleurs, c'est-à-dire . Sinon, on peut montrer que l'espérance de est . Pour et fixes , il semblerait que le facteur par lequel multiplier serait maximal lorsque est uniforme; peut-être que le nombre attendu de couleurs différentes vu être borné en fonction de et, par exemple, l'entropie de ?p i = 1 / P i n γ = P ( n / N ) γ > P ( n / N ) Pn / N p n / N p
Cela semble lié au problème du collecteur de coupons, sauf que l'échantillonnage est effectué sans remplacement et que la distribution des coupons n'est pas uniforme.
Réponses:
Supposons que vous ayez couleurs où k ≤ N . Laissez - b i indiquer le nombre de couleurs de boules i donc Σ b i = N . Laissez B = { b 1 , ... , b k } et laisser E i ( B ) Notate l'ensemble qui se compose des i sous - ensembles d'éléments de B . Soit Qk k ≤ N bje je ∑ bje= N B = { b1, … , Bk} Eje( B ) je B le nombre de façons dont nous pouvons choisirnQn , c n des éléments de l'ensemble ci-dessus de telle sorte que le nombre de couleurs différentes dans l'ensemble choisi est . Pour c = 1 la formule est simple:c c = 1
Pour on peut compter des jeux de boules de taille n qui ont au plus 2 couleurs moins le nombre de jeux qui ont exactement 1 couleur:c = 2 n 1
est le nombre de façons dont vous pouvez ajouter une couleur à une couleur fixe de telle sorte que vous aurez 2 couleurs si vous avezau totalkcouleurs. La formule générique est si vous avezc1couleurs fixes etvous voulez fairec2couleurs sur toutayantkcouleurs au total (c1≤c2≤k) est ( k-c1( k-11) k c1 c2 k c1≤ c2≤ k . Maintenant, nous avons tout pour dériver la formule générique pourQn,c:( k- c1c2- c1) Qn , c
La probabilité que vous ayez exactement couleurs si vous dessinez n boules est:c n
Notez également que( xy) =0 si .y> x
Il existe probablement des cas particuliers où la formule peut être simplifiée. Je n'ai pas pris la peine de trouver ces simplifications cette fois.
La valeur attendue dont vous recherchez le nombre de couleurs dépendant est la suivante:n
la source