Mettre un prior sur le paramètre de concentration dans un processus de Dirichlet

9

La plupart de ces informations sont d'ordre général, passez à la fin si vous en savez déjà assez sur les mélanges de procédés Dirichlet . Supposons que je modélise certaines données comme provenant d'un mélange de processus de Dirichlet, c'est-à-dire que et conditionnel à supposentFD(αH)F

Yiiidf(y|θ)F(dθ).

Ici et est la mesure de base antérieure. Il s'avère que si pour chaque observation , si je connais le latent , la probabilité de dans ce modèle est où est le nombre de valeurs distinctes de (la mesure aléatoire est discrète presque sûrement). Escobar et West développent le schéma suivant d'échantillonnage utilisant un a priori gamma; d'abord, ils écriventα>0αHYiθiα

L(α|t)αtΓ(α)Γ(α+n)
tθiFα
π(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αt1(α+n)B(α+1,n)=π(α)αt1(α+n)01xα(1x)n1 dx,
où est la fonction bêta. Ensuite, notez que si nous introduisons un paramètre latent alors la probabilité a la forme d'un mélange de distributions Gamma et l'utilisons pour écrire un échantillonneur Gibbs.B(,)XBeta(α+1,n)

Maintenant ma question. Pourquoi ne pouvons-nous pas simplement écrire et au lieu d'utiliser un mélange de distributions Gamma, utiliser une seule distribution Gamma? Si nous introduisons ne devrais-je pas pouvoir faire la même chose mais sans avoir besoin d'utiliser le mélange?

L(α|t)αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)αt01xα1(1x)n1 dx,
XBeta(α,n)

Modifier pour plus de détails Plus de détails: Pour combler certaines lacunes, l'argument dans Escobar et West est que, laissant avoir une distribution Gamma avec la forme et signifie , et nous pouvons donc introduire un latent pour queLes conditions complètes sont une distribution pour et un mélange de et aαaa/b

π(α|t)αa+t2(α+n)ebα01xα(1x)n1 dx
X
π(α,x|t)αa+t2(α+n)ebαxα(1x)n1.
Beta(α+1,n)XG(a+t,blog(x))G(a+t1,blog(x)) pour .α

Par le même argument, j'ai obtenu le même résultat mais avec pour et pour . Cela me semble plus facile; pourquoi ne font-ils pas ça?Beta(α,n)XG(a+t,blog(x))α

gars
la source

Réponses:

3

Je ne vois pas en quoi ce que vous avez écrit est fondamentalement différent d'Escobar et de West.

π(α|t)π(α)π(t|α)=π(α)L(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αtΓ(α)Γ(n)Γ(α+n)=π(α)αtB(α,n)=π(α)αt1(α+n)B(α+1,n)
où l'avant-dernière ligne indique comment vous l'avez et la dernière ligne comment E&W a et ils sont égaux puisque n) \ end {eqnarray *} rappelant que
αB(α,n)=αΓ(α)Γ(n)Γ(α+n)=(αΓ(α))Γ(n)(α+n)(Γ(α+n)(α+n))=(α+n)Γ(α+1)Γ(n)Γ(α+n+1)=(α+n)B(α+1,n)
Γ(z+1)=zΓ(z) .

Je suppose qu'ils ont préféré leur formulation au vôtre car elle n'a que le terme de fonction Bêta, pas le produit d'une Bêta et d'un Gamma, mais je peux me tromper. Je n'ai pas tout à fait suivi le dernier morceau que vous avez écrit, pourriez-vous être plus explicite sur votre plan d'échantillonnage?

Daniel Johnson
la source
Ajout de détails supplémentaires dans mon post.
gars