Nombre attendu de couleurs distinctes lors du dessin sans remplacement

15

Considérons une urne contenant boules de couleurs différentes, étant la proportion de boules de couleur parmi les boules ( ). Je dessine boules de l'urne sans remplacement et regarde le nombre de couleurs différentes parmi les boules qui ont été tirées. Quelle est l'attente de en fonction de , selon les propriétés appropriées de la distribution ?P p i i N i p i = 1 n NNPpjejeNjepje=1nNγ n / N pγγn/Np

Pour donner plus d'informations: si et pour tout , alors je verrai toujours exactement couleurs, c'est-à-dire . Sinon, on peut montrer que l'espérance de est . Pour et fixes , il semblerait que le facteur par lequel multiplier serait maximal lorsque est uniforme; peut-être que le nombre attendu de couleurs différentes vu être borné en fonction de et, par exemple, l'entropie de ?p i = 1 / P i n γ = P ( n / N ) γ > P ( n / N ) PN=Ppje=1/Pjenγ=P(n/N)γ>P(n/N)Pn / N p n / N pNn/Npn/Np

Cela semble lié au problème du collecteur de coupons, sauf que l'échantillonnage est effectué sans remplacement et que la distribution des coupons n'est pas uniforme.

a3nm
la source
1
Je pense que ce problème peut être énoncé comme suit: quel est le nombre prévu d'entrées non nulles dans un échantillon à partir d'une distribution hypergéométrique multivariée ?
Kodiologist

Réponses:

2

Supposons que vous ayez couleurs où k N . Laissez - b i indiquer le nombre de couleurs de boules i donc Σ b i = N . Laissez B = { b 1 , ... , b k } et laisser E i ( B ) Notate l'ensemble qui se compose des i sous - ensembles d'éléments de B . Soit QkkNbjejebje=NB={b1,,bk}Eje(B)jeB le nombre de façons dont nous pouvons choisirnQn,cndes éléments de l'ensemble ci-dessus de telle sorte que le nombre de couleurs différentes dans l'ensemble choisi est . Pour c = 1 la formule est simple:cc=1

Qn,1=EE1(B)(eEen)

Pour on peut compter des jeux de boules de taille n qui ont au plus 2 couleurs moins le nombre de jeux qui ont exactement 1 couleur:c=2n1

Qn,2=EE2(B)(eEen)-(k-11)Qn,1

est le nombre de façons dont vous pouvez ajouter une couleur à une couleur fixe de telle sorte que vous aurez 2 couleurs si vous avezau totalkcouleurs. La formule générique est si vous avezc1couleurs fixes etvous voulez fairec2couleurs sur toutayantkcouleurs au total (c1c2k) est ( k-c1(k-11)kc1c2kc1c2k. Maintenant, nous avons tout pour dériver la formule générique pourQn,c:(k-c1c2-c1)Qn,c

Qn,c=EEc(B)(eEen)-je=1c-1(k-jec-je)Qn,je

La probabilité que vous ayez exactement couleurs si vous dessinez n boules est:cn

Pn,c=Qn,c/(Nn)

Notez également que (Xy)=0 si .y>X

Il existe probablement des cas particuliers où la formule peut être simplifiée. Je n'ai pas pris la peine de trouver ces simplifications cette fois.

La valeur attendue dont vous recherchez le nombre de couleurs dépendant est la suivante:n

γn=je=1kPn,jeje
jakab922
la source
4
Vous appelez une probabilité, mais vous semblez l'avoir définie comme une somme d'entiers. Avez-vous oublié de diviser par quelque chose? Pn,c
Kodiologist
Oui, je suppose que tu as raison. Vous devez diviser par , mais malheureusement, ce n'est toujours pas le cas. SiE,FEc(B)etEFje compte deux fois dans la formule ci-dessus. (Nn)E,FEc(B)EF
jakab922
Il semble que la formule puisse être corrigée en utilisant la méthode du tamis. Je publierai un correctif plus tard dans la journée.
jakab922