Densité hyperprior pour le modèle hiérarchique Gamma-Poisson

11

Dans un modèle hiérarchique de données où il semble typique en pratique de choisir des valeurs ( sorte que la moyenne et la variance de la distribution gamma correspondent à peu près à la moyenne et à la variance des données (par exemple, Clayton et Kaldor, 1987 "Empirical Bayes Estimates of Age-Standardized Relative Risks for Disease Mapping", Biometrics ). De toute évidence, ce n'est qu'une solution ad hoc , car elle exagère la confiance du chercheur dans les paramètresy Poisson ( λ ) λ Gamma ( α , β ) α , β ) yy

yPoisson(λ)
λGamma(α,β)
α,β)y(α,β)et de petites fluctuations dans les données réalisées pourraient avoir de grandes conséquences sur la densité gamma, même si le processus de génération de données sous-jacent reste le même.

De plus, dans Bayesian Data Analysis (2nd Ed), Gelman écrit que cette méthode est « bâclée »; dans le livre et cet article (à partir de la p. 3232), il suggère plutôt de choisir une densité hyperpriorique , d'une manière similaire à l' exemple des tumeurs de rat (à partir de la p. 130).p(α,β)

Bien qu'il soit clair que tout est admissible tant qu'il produit une densité postérieure finie, je n'ai trouvé aucun exemple de densité hyperprioritaire que les chercheurs ont utilisé pour ce problème dans le passé. J'apprécierais grandement que quelqu'un me pointe vers des livres ou des articles qui ont utilisé une densité hyperprior pour estimer un modèle de Poisson-Gamma. Idéalement, je m'intéresse à qui est relativement plat et serait dominé par les données comme dans l'exemple de la tumeur du rat, ou une discussion comparant plusieurs spécifications alternatives et les compromis associés à chacune.p(α,β)p(α,β)

Sycorax dit de réintégrer Monica
la source

Réponses:

5

Je ne réponds pas vraiment à la question, car je ne vous pointe pas vers des livres ou des articles qui ont employé un hyperprior, mais au lieu de cela je décris, et je lie à, des trucs sur les antérieurs sur les paramètres Gamma.

Notons tout d'abord que le modèle de Poisson-Gamma conduit, lorsque est intégré, à une distribution binomiale négative avec les paramètres et . Le deuxième paramètre est dans la plage . Si vous souhaitez ne pas être informatif, un avant Jeffreys sur pourrait être approprié. Vous pouvez mettre le prieur directement sur ou travailler sur le changement de variables pour obtenir:λαβ/(1+β)(0,1)p=β/(1+β)p

p(β)β1/2(1+β)1

Alternativement, vous pouvez noter que est le paramètre d'échelle pour la distribution Gamma, et, de manière générique, le précédent de Jeffreys pour un paramètre d'échelle est . On pourrait trouver étrange que le précédent de Jeffreys pour soit différent entre les deux modèles, mais les modèles eux-mêmes ne sont pas équivalents; on est pour la distribution de et l'autre est pour la distribution de . Un argument en faveur de la première est que, en supposant qu'il n'y ait pas de clustering, les données sont vraiment distribuées Binomial négatif , mettant ainsi les priors directement sur etβ 1 / β β y | α , β λ | α , β ( α , p ) α p λ λ βββ1/ββy|α,βλ|α,β(α,p)αpest la chose à faire. OTOH, si, par exemple, vous avez des clusters dans les données où les observations dans chaque cluster ont le même , vous devez vraiment modéliser les s d'une manière ou d'une autre, et donc traiter comme paramètre d'échelle d'une distribution Gamma serait semblent plus appropriés. (Mes réflexions sur un sujet éventuellement litigieux.)λλβ

Le premier paramètre peut également être adressé via les a priori de Jeffreys. Si nous utilisons la technique courante consistant à développer des prieurs de Jeffreys pour chaque paramètre indépendamment, puis à former le joint (non-Jeffreys) avant comme produit des deux prieurs à paramètre unique, nous obtenons un a priori pour le paramètre de forme d'une distribution Gamma :α

p(α)PG(1,α)

PG(1,α)=i=0(i+α)21/β

Si nous souhaitons suivre la route Full Jeffreys, formant le véritable Jeffreys avant pour les paramètres Gamma, nous obtiendrions:

p(α,β)αPG(1,α)1/β

Cependant, les a priori de Jeffreys pour les paramètres multidimensionnels ont souvent de mauvaises propriétés ainsi que de mauvaises caractéristiques de convergence (voir le lien vers le cours ). Je ne sais pas si c'est le cas pour le Gamma, mais les tests fourniraient des informations utiles.

Pour en savoir plus sur les prieurs pour le Gamma, consultez les pages 13-14 du catalogue des prieurs non informatifs , Yang et Berger. Beaucoup d'autres distributions s'y trouvent également. Pour un aperçu de Jeffreys et des références antérieures, voici quelques notes de cours .

jbowman
la source
Merci pour la réponse très détaillée. Il me faudra quelques heures pour lire entièrement les documents à l'appui et généralement digérer le contenu du message. Veuillez ne pas confondre mon rythme lent avec un manque de gratitude.
Sycorax dit Réintégrer Monica