Le changement d'étiquette (c.-à-d. Que la distribution postérieure est invariante à la commutation des étiquettes des composants) est un problème problématique lors de l'utilisation de MCMC pour estimer les modèles de mélange.
Existe-t-il une méthodologie standard (comme largement acceptée) pour traiter le problème?
S'il n'y a pas d'approche standard, quels sont les avantages et les inconvénients des principales approches pour résoudre le problème de changement d'étiquette?
Réponses:
Il y a une discussion agréable et raisonnablement récente de ce problème ici:
Essentiellement, il existe plusieurs stratégies standard, et chacune a ses avantages et ses inconvénients. La chose la plus évidente à faire est de formuler l'a priori de manière à garantir qu'il n'y a qu'un seul mode postérieur (par exemple, commander les moyens des composants de mixuture), mais cela se révèle avoir un effet étrange sur le postérieur, et n'est donc généralement pas utilisé. La prochaine étape consiste à ignorer le problème lors de l'échantillonnage, puis à post-traiter la sortie pour ré-étiqueter les composants afin de conserver les étiquettes cohérentes. Ceci est facile à mettre en œuvre et semble fonctionner correctement. Les approches les plus sophistiquées ré-étiquettent en ligne, soit en conservant un seul mode, soit en permutant délibérément au hasard les étiquettes pour assurer le mélange sur plusieurs modes. J'aime bien cette dernière approche, mais cela laisse toujours le problème de résumer la sortie de manière significative. Cependant, je vois cela comme un problème distinct.
la source
Gilles Celeux a également travaillé sur le problème du changement d'étiquette, par exemple
En complément de la bonne réponse de @ darrenjw, voici deux articles en ligne qui ont passé en revue les stratégies alternatives:
la source