Est-il important de savoir comment vous échantillonnez une population?

9

J'ai une cuve bien mélangée contenant un nombre infini de billes. Il y a une quantité infinie de billes dans la cuve, mais elles ne viennent que dans un nombre inconnu mais fini de variétés : k est inconnu, et pour i \ neq j , dessiner une bille de type v_i pourrait être plus probable que dessiner une bille de type v_j .

V={v1,v2,v3,...,vk}
kijvivj

Dans une expérience, une machine échantillonne la cuve en utilisant une procédure inconnue. La machine rapporte un ensemble X décrivant qk variétés de billes de son échantillon:

XV;|X|=q

Les essais de cette expérience sont répétés ( q est fixé d'un essai à l'autre) et nous obtenons une séquence de sous-ensembles de V , (X1,X2,) .

Les seules autres choses que nous connaissons sont:

  • les essais sont indépendants et identiques
  • la machine signale les q variétés les plus fréquemment rencontrées dans son échantillon

Nous ne savons pas précisément comment la machine échantillonne les billes. Il pourrait cueillir un grand nombre de billes, puis signaler le q plus fréquent. Alternativement, il pourrait continuer à ramasser des billes jusqu'à ce qu'il y ait q variétés. Il pourrait aussi faire autre chose.

La distribution de nos essais (X1,X2,) sera-t-elle affectée par la procédure d'échantillonnage de la machine?

Christian Chapman
la source
3
+1 C'est une excellente question, car il apprécie que l'échantillonnage aléatoire ne se limite pas à une forme arbitraire vague ou à un manque de connaissances sur la procédure d'échantillonnage.
whuber
La règle d'échantillonnage importera certainement. Sinon, envisagez cette procédure: la machine, à chaque essai, sélectionne toujours une seule bille de type 1 (première variété). Chaque tirage sera indépendant et aura une distribution identique (trivialement), et vous obtiendrez q = 1, un résultat parfaitement inutile.
AlaskaRon

Réponses:

9

Un moyen simple de vérifier que la méthode compte est de choisir des probabilités particulières pour les types de billes et de calculer les chances de chaque sous-ensemble selon certaines méthodes. Cela ne peut cependant pas prouver que la méthode n'a pas d'importance.

Supposons qu'il existe types et les chances de chaque type sont31/2 , , et 1 / quatre , respectivement. Supposons que vous choisissez 2 types de billes.1/41/42

{v2,v3}21/41/3=1/6

{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

Comme ils sont différents, la méthode utilisée par la machine est importante. Le rejet des paires avec des types répétés tend à peser moins les paires avec des types communs.

q

Douglas Zare
la source