J'ai regardé une question d'augmentation de données MCMC; la forme générale de la question est la suivante:
Supposons que les données recueillies sur un processus suggèrent et qu'un a priori pour le paramètre de débit soit suggéré comme . Les données sont enregistrées et présentées sous une forme typique (c'est-à-dire le nombre d'occurrences de chaque valeur pour de à ), cependant, les données recueillies ne font pas de discrimination dans les cas où (c'est-à-dire toutes les occurrences où et sont regroupées en une seule catégorie).
Compte tenu des données, de la probabilité et de la priorité décrites ci-dessus, la question demande:
La forme postérieure de ,
Le nombre d'occurrences où .
Je ne sais pas vraiment comment répondre à cette question, mais je suis conscient que l'échantillonnage de Gibbs peut être utilisé dans l'augmentation des données. Quelqu'un at-il des informations sur la façon dont cela pourrait être fait?
ÉDITER:
Je dois préciser que c'est principalement la deuxième partie (le nombre d'occurrences où ) dont je ne suis pas sûr. Pour la première partie (la forme postérieure de ), étant donné la vraisemblance et le prior suggéré, j'ai raisonné (bien que je sois heureux d'être corrigé):
Donné:
Donc, pour le modèle donné ci-dessus:
Simplifier les rendements:
qui est proportionnelle à (et donc la forme postérieure est donnée par):
la source