Pourquoi nous avons besoin d'un tracé de trace pour les résultats MCMC

12

Je lis des documents de recherche en utilisant les méthodes MCMC et je vois que la plupart d'entre eux fournissent des tracés de trace. Pourquoi avons-nous besoin de tracés de trace dans la chaîne de Monte Carlo Markov? Qu'est-ce qu'un tracé de paramètres indique?

Benzamine
la source

Réponses:

17

Vous créez les tracés de suivi des paramètres pour vous assurer que votre distribution a priori est bien calibrée, ce qui est indiqué par vos paramètres ayant suffisamment de changements d'état lors de l'exécution de l'algorithme MCMC.

Un exemple extrême est que vous définissez votre variance de distribution a priori à 0. Ensuite, l'estimation du paramètre postérieur ne changera jamais. Votre algorithme dirait que vous disposez de la meilleure estimation des paramètres, mais il n'a pas vérifié un nombre suffisant de paramètres pour déterminer s'il s'agit vraiment du meilleur ajustement. Si vous définissez la variance de distribution a priori trop élevée, vous obtenez un problème similaire. Cela est dû au fait que le nouveau paramètre est moins susceptible d'être lié à vos données - la probabilité de log calculée avec votre nouveau paramètre n'est donc probablement pas meilleure que la probabilité de log utilisant l'ancien paramètre. (Par exemple, si votre "vrai" paramètre est 0,5 et votre estimation initiale est 2, mais que vous effectuez une sélection dans une distribution normale avec une moyenne de 2 et une variance de 10 000, il est peu probable que vous obteniez un paramètre plus proche de 1. .

Vous devez sélectionner une variance a priori qui permet à vos états de paramètres de changer suffisamment pour que vous ne restiez pas coincé sur les minimums et maximums locaux dans la distribution de loglik vraisemblance, mais pourtant assez fin pour obtenir des estimations de paramètres raisonnables. La plupart des publications suggèrent que vos paramètres changent d'état de 40 à 60% du temps.

Une autre raison des tracés de trace est la rémanence. Habituellement, la période de rémanence est évidente dans le graphique (par exemple, si le vrai paramètre est 1,5 et votre estimation initiale est 4, vous devriez voir les estimations des paramètres passer rapidement de 4 à 1,5). puis "rebondir" autour de 1,5). En règle générale, vous excluez simplement les n premières itérations où n est suffisamment grand pour que vous soyez certain d'avoir supprimé la brûlure (disons 1000), mais si les calculs prennent du temps ou si vos estimations de paramètres mettent beaucoup plus de temps à converger que votre n permet alors d'omettre plus ou moins d'observations pour tenir compte de la gravure. Vous pouvez vérifier vos graphiques pour voir où se termine la période de gravure afin de vous assurer que la gravure n'affecte pas vos résultats.

Notez que j'ai parlé dans le contexte des estimations ponctuelles des paramètres. Si vous estimez la variance des paramètres, il est encore plus important de vous assurer que vous disposez des changements d'état appropriés.

Eric
la source
5
+1 Mais le revers de la médaille, c'est que nous ne faisons pas totalement confiance aux diagnostics formels de convergence et que nous voulons regarder quelque chose avant de prétendre qu'il a convergé. Que ce soit entièrement rationnel est une autre question ...
conjugateprior
1
Désolé de déterrer cet ancien message. Mais la valeur antérieure (générée à partir de la distribution précédente) n'est-elle pas censée être sans pertinence tant qu'il y a un nombre suffisant d'itérations?
mscnvrsy
@mscnvrsy: vous pouvez mettre un prior non informatif comme le précédent de Jeffry ou un précédent uniforme si vous souhaitez fournir moins d'informations à votre préalable.
Benzamin
3
Je suis totalement en désaccord avec l'idée que les tracés de trace MCMC sont liés de quelque manière que ce soit à l'étalonnage d'une distribution antérieure. Un algorithme MCMC vise une distribution postérieure donnée, sans rapport avec le choix de l'a priori, et crée dans des conditions appropriées une chaîne de Markov qui converge vers cette distribution stationnaire. L'examen des tracés de trace n'est utile que pour évaluer la convergence ou l'absence de convergence de la chaîne de Markov.
Xi'an