Existe-t-il une méthode standard pour traiter le problème de changement d'étiquette dans l'estimation MCMC des modèles de mélange?

15

Le changement d'étiquette (c.-à-d. Que la distribution postérieure est invariante à la commutation des étiquettes des composants) est un problème problématique lors de l'utilisation de MCMC pour estimer les modèles de mélange.

  1. Existe-t-il une méthodologie standard (comme largement acceptée) pour traiter le problème?

  2. S'il n'y a pas d'approche standard, quels sont les avantages et les inconvénients des principales approches pour résoudre le problème de changement d'étiquette?

whuber
la source
J'envisageais de demander "Comment puis-je faire un modèle MCMC de la sortie sur lmer pour les modèles à pentes aléatoires?" mais je me demande si cette question est redondante avec celle-ci. Autrement dit, le «problème de changement d'étiquette» lors de l'utilisation de MCMC pour estimer des modèles de mélange est-il le même type de problème qui fait que pvals.fnc () dans languageR est capable d'intercepter MCMC des modèles mais pas des modèles avec des pentes? Sinon, faites-le moi savoir et je reviendrai pour poser ma question initiale.
russellpierce
@drknexus Je ne connais pas R pour commenter votre question. Peut-être, vous devriez simplement poster votre question avec un commentaire que votre qn peut être aligné sur celui-ci.

Réponses:

14

Il y a une discussion agréable et raisonnablement récente de ce problème ici:

Christian P. Robert Multimodalité et changement d'étiquette: une discussion. Atelier sur les mélanges, ICMS 3 mars 2010.

Essentiellement, il existe plusieurs stratégies standard, et chacune a ses avantages et ses inconvénients. La chose la plus évidente à faire est de formuler l'a priori de manière à garantir qu'il n'y a qu'un seul mode postérieur (par exemple, commander les moyens des composants de mixuture), mais cela se révèle avoir un effet étrange sur le postérieur, et n'est donc généralement pas utilisé. La prochaine étape consiste à ignorer le problème lors de l'échantillonnage, puis à post-traiter la sortie pour ré-étiqueter les composants afin de conserver les étiquettes cohérentes. Ceci est facile à mettre en œuvre et semble fonctionner correctement. Les approches les plus sophistiquées ré-étiquettent en ligne, soit en conservant un seul mode, soit en permutant délibérément au hasard les étiquettes pour assurer le mélange sur plusieurs modes. J'aime bien cette dernière approche, mais cela laisse toujours le problème de résumer la sortie de manière significative. Cependant, je vois cela comme un problème distinct.

Darren Wilkinson
la source
1
semble que le lien soit rompu
Edgar Santos
J'ai corrigé le lien en le trouvant sur web.archive.org et en fournissant un lien vers une copie de ces diapositives hébergées par l'auteur sur SlideShare.
Tim
9

Gilles Celeux a également travaillé sur le problème du changement d'étiquette, par exemple

G. Celeux, inférence bayésienne pour Mixture: le problème de changement d'étiquette. Actes Compstat 98 , pp. 227-232, Physica-Verlag (1998).

En complément de la bonne réponse de @ darrenjw, voici deux articles en ligne qui ont passé en revue les stratégies alternatives:

  1. Jasra et al., Markov Chain Monte Carlo Methods and the Label Switching Problem in Bayesian Mixture Modeling
  2. Sperrin et al., Stratégies de réétiquetage probabilistes pour le problème de changement d'étiquette dans les modèles de mélange bayésien
chl
la source