J'ai une cuve bien mélangée contenant un nombre infini de billes. Il y a une quantité infinie de billes dans la cuve, mais elles ne viennent que dans un nombre inconnu mais fini de variétés : k est inconnu, et pour i \ neq j , dessiner une bille de type v_i pourrait être plus probable que dessiner une bille de type v_j .
Dans une expérience, une machine échantillonne la cuve en utilisant une procédure inconnue. La machine rapporte un ensemble décrivant variétés de billes de son échantillon:
Les essais de cette expérience sont répétés ( est fixé d'un essai à l'autre) et nous obtenons une séquence de sous-ensembles de , .
Les seules autres choses que nous connaissons sont:
- les essais sont indépendants et identiques
- la machine signale les variétés les plus fréquemment rencontrées dans son échantillon
Nous ne savons pas précisément comment la machine échantillonne les billes. Il pourrait cueillir un grand nombre de billes, puis signaler le plus fréquent. Alternativement, il pourrait continuer à ramasser des billes jusqu'à ce qu'il y ait variétés. Il pourrait aussi faire autre chose.
La distribution de nos essais sera-t-elle affectée par la procédure d'échantillonnage de la machine?
la source
Réponses:
Un moyen simple de vérifier que la méthode compte est de choisir des probabilités particulières pour les types de billes et de calculer les chances de chaque sous-ensemble selon certaines méthodes. Cela ne peut cependant pas prouver que la méthode n'a pas d'importance.
Supposons qu'il existe types et les chances de chaque type sont3 1/2 , , et 1 / quatre , respectivement. Supposons que vous choisissez 2 types de billes.1/4 1/4 2
Comme ils sont différents, la méthode utilisée par la machine est importante. Le rejet des paires avec des types répétés tend à peser moins les paires avec des types communs.
la source