Échantillonnage à partir d'une distribution marginale à l'aide d'une distribution conditionnelle?

12

Je veux échantillonner à partir d'une densité univariée mais je ne connais que la relation:fX

fX(x)=fX|Y(x|y)fY(y)dy.

Je veux éviter l'utilisation de MCMC (directement sur la représentation intégrale) et, comme et sont faciles à échantillonner, je pensais utiliser l'échantillonneur suivant :f Y ( y )fX|Y(x|y)fY(y)

  1. Pour .j=1,,N
  2. Exemple .yjfY
  3. Exemple .xjfX|Y(|yj)

Ensuite, je vais me retrouver avec les paires , et ne prendre que les échantillons marginaux . Est-ce correct?( x 1 , , x N )(x1,y1),...,(xN,yN)(x1,,xN)

Barre
la source

Réponses:

10

Oui, c'est correct. En gros, vous avez

fX,Y(x,y)=fX|Y(x|y)fY(y),

et comme vous l'avez dit, vous pouvez échantillonner à partir de la densité des joints. Prendre uniquement les s des échantillons vous conduit à un échantillon de la distribution marginale.x

En effet, le fait d'ignorer le s'apparente à une intégration par-dessus. Permet de comprendre cela avec un exemple.y

Supposons = taille des mères et Y = taille des filles. L'objectif est d'obtenir un échantillon de ( X , Y ) pour comprendre la relation entre les hauteurs des filles et de leurs mères. (Je fais l'hypothèse qu'il n'y a qu'une seule fille dans la famille et je limite la population à toutes les filles de plus de 18 ans pour assurer leur pleine croissance).XY(X,Y)

Vous sortez et obtenez un échantillon représentatif

(x1,y1),,(xN,yN).

XYYNX

Greenparker
la source
Merci pour cela, c'est utile. Savez-vous si cette stratégie d'échantillonnage peut être liée à l'échantillonnage de Gibbs afin de la justifier formellement?
Rod
1
yxyy
1
Greenparker, mais existe-t-il une preuve formelle de cette affirmation, c'est-à-dire qu'en considérant qu'une partie seulement de l'échantillon prélevé sur le joint donne un échantillon du marginal?
Un vieil homme dans la mer.
L'échantillonnage de "X = mères" par échantillonnage (X, Y) et en prenant X vous donne en fait des échantillons de "mères qui ont exactement une fille adulte", ce qui n'est pas différent de "mères". Mais même si nous changeons votre exemple pour dire que vous êtes intéressé par "X = mères qui ont exactement une fille adulte", obtenir X en échantillonnant (X, Y) biaise votre échantillon en fonction de la distribution de Y. p (v ) = ∑ (u en support (U)) (p (u, v))) = ∑ (u en support (U)) (p (v | u) * p (u))) = (1 / sampleSize ( u)) * ∑ (u dans l'échantillon (U)) (p (v | u))), car chaque valeur de u apparaît dans l'échantillon avec la probabilité p (u) - il faut donc faire la moyenne du p (v | u) tirages
radumanolescu