Dans MCMC, comment le temps de rodage est-il choisi?

8

Dans MCMC, comment le temps de rodage est-il choisi? En d'autres termes, combien de temps devez-vous attendre avant de penser que la chaîne Markov a atteint sa distribution limite? Merci!

Tim
la source

Réponses:

6

Il existe plusieurs diagnostics, notamment le diagnostic Geweke, le diagnostic Heidelberg et Welch, le diagnostic Raftery et Lewis et le diagnostic séquentiel multiple Gelman et Rubin. De plus, un examen visuel du tracé peut être utile. Ce ne sont que des indications, pas des garanties.

Vous pouvez consulter:

http://www.people.fas.harvard.edu/~plam/teaching/methods/convergence/convergence_print.pdf ou

http://www.stat.duke.edu/courses/Fall10/sta290/Lectures/Diagnostics/param-diag.pdf

EDIT: De plus, vous ne pouvez pas déterminer à l'avance la durée de rodage. Vous regardez votre course - comme suggéré ci-dessus - et s'il semble que les choses ont convergé à la fin de votre burn-in, le burn-in que vous avez fait est assez long.

Wayne
la source
1
Ces diagnostics ne vous disent pas ce que vous voulez vraiment savoir. Ils disent que si la chaîne converge, alors le diagnostic dira probablement qu'elle converge, mais ils ne disent pas que si la chaîne pseudo-converge, alors le diagnostic dira probablement que la chaîne n'a pas convergé. Ceux qui prétendent diagnostiquer de manière fiable la pseudo-convergence ont des conditions invérifiables qui les rendent inutiles.
Glen
Comme je l'ai dit, ce ne sont que des indicateurs, pas des garanties. En fait, je ne vois aucun moyen de diagnostiquer réellement la pseudo-convergence. Pour ce faire, vous devez déjà connaître la véritable distribution, mais alors pourquoi MCMC?
Wayne
1
Exact, je voulais juste souligner ce point.
Glen
4

Je voudrais exécuter le MCMC plusieurs fois (avec différentes valeurs de départ) et tracer la log-vraisemblance avec des estimations de paramètres dans le temps (ou le nombre d'itérations). J'espère que vous voyez une tendance pour le nombre d'itérations pour que la chaîne entre dans la distribution stationnaire. J'utiliserais alors cette valeur (et j'ajouterais un peu plus pour être prudent) comme temps de rodage.

Bien sûr, rien ne garantit que cela fonctionnera dans tous les scénarios ou que vous avez entré les véritables distributions stationnaires dans vos simulations. Par conséquent, ce conseil doit être pris avec un grain de sel.

Glen
la source