Estimation bayésienne des paramètres de distribution de Dirichlet

8

Je veux estimer les paramètres des modèles de mélange de Dirichlet en utilisant l'échantillonnage de Gibbs et j'ai quelques questions à ce sujet:

  1. Un mélange de distributions de Dirichlet est-il équivalent à un processus de Dirichlet? Quelles sont leurs principales différences si ce n'est pas le cas?

  2. De plus, si je veux estimer les paramètres d'une seule distribution de Dirichlet, quelle distribution de paramètres doit-on sélectionner comme a priori dans le cadre bayésien?

Dans tous les articles, j'ai trouvé une estimation d'une distribution multinomiale en utilisant des a priori de Dirichlet. J'ai peut-être besoin d'une estimation d'une distribution de Dirichlet utilisant des a priori multinomiaux.

La fonction postérieure est-elle également sous forme de DIRICHLET (α + N) similaire au cas «estimation de la distribution multinomiale à l'aide des a priori de Dirichlet»? car la multiplication de la fonction de densité de probabilité pour les échantillons iid n'est pas prise en compte dans la définition de la fonction de vraisemblance. Encore une fois, je ne comprends pas pourquoi.

par exemple, comme indiqué dans ce document: http://www.stat.ufl.edu/~aa/cda/bayes.pdf ou http://research.microsoft.com/en-us/um/people/minka/papers/ minka-multinomial.pdf


merci pour votre attention

mes données sont Hyperion (une sorte d'imagerie de télédétection hyperspectrale) et je veux effectuer un démixage hyperspectral en utilisant un mélange de sources Dirichlet et j'appliquerai la méthode d'échantillonnage de Gibbs pour l'estimation des paramètres. mes données sont en dimension (614 * 512 * 224) qui sont des données de capteur AVIRIS communément disponibles pour le district de Cuprite Nevada et font près de 200 Mo. ces données sont également disponibles via ( http://aviris.jpl.nasa.gov/data/free_data.html ). malheureusement, je ne sais pas comment envoyer mes données.

je vous demande juste de m'aider dans les tâches de modélisation statistique pour ma thèse de doctorat. je serai tellement reconnaissant si vous m'aidez à résoudre mes confusions dans la modélisation.

tous les meilleurs solmaz

Solmaz
la source
Dans le cas unidimensionnel, la distribution de Dirichlet est une distribution bêta, et l'inférence bayésienne sur les paramètres bêta n'est pas un problème bien connu.
Stéphane Laurent
1: Non 2: Il n'y a aucun a priori conventionnel pour les paramètres de Dirichlet (voir ici pour une discussion). Cependant, comme l'a noté @Zen, vous devez fournir plus d'informations sur les données dont vous disposez et l'objectif de votre analyse si vous souhaitez de meilleurs conseils.
jerad

Réponses:

3

Pour calculer la densité de tout conjugué préalable, voir ici .

Cependant, vous n'avez pas besoin d'évaluer le conjugué avant de Dirichlet pour effectuer une estimation bayésienne de ses paramètres. Faites simplement la moyenne des statistiques suffisantes de tous les échantillons, qui sont les vecteurs de log-probabilités des composantes de vos paramètres de distribution catégorielle observés. Cette statistique suffisante moyenne sont les paramètres d'espérance du maximum de vraisemblance Dirichlet ajustant les données . Pour passer des paramètres d'attente aux paramètres source, par exemple , vous devez résoudre à l'aide de méthodes numériques: où est la fonction digamma.(χje)je=1n(αje)je=1n

χje=ψ(αje)-ψ(jαj)je
ψ

Pour répondre à votre première question, un mélange de Dirichlets n'est pas Dirichlet car, d'une part, il peut être multimodal.

Neil G
la source