En référence à ce fil: Comment expliqueriez-vous Markov Chain Monte Carlo (MCMC) à un profane? .
Je peux voir qu'il s'agit d'une combinaison de chaînes de Markov et de Monte Carlo: une chaîne de Markov est créée avec le postérieur comme distribution limite invariante, puis les tirages de Monte Carlo (dépendants) sont faits à partir de la distribution limite (= notre postérieure).
Disons (je sais que je simplifie ici) qu'après étapes nous sommes à la distribution limite Π (*).
La chaîne de Markov étant une séquence de variables aléatoires, j'obtiens une séquence , où X i est une variable aléatoire et Π est la variable aléatoire '' limite '' dont nous souhaitons goûter.
Le MCMC part d'une valeur initiale, c'est-à-dire que est une variable aléatoire avec toute la masse à cette seule valeur x 1 . Si j'utilise des lettres majuscules pour les variables aléatoires et des lettres minuscules pour les réalisations d'une variable aléatoire, le MCCM me donne une séquence x 1 , x 2 , x 3 , ... x L , π 1 , π 2 , π 3 , . . . . π n . La longueur de la chaîne MCMC est donc L + n.
[[* Remarque: les majuscules sont des variables aléatoires (c'est-à-dire tout un tas de résultats) et les petits sont des résultats, c'est-à-dire une valeur particulière. *]]
Évidemment, seul le appartient à mon '' postérieur '' et pour approximer le '' bien '' postérieur la valeur de n doit être '' assez grande ''.
Si je résume ce que j'ai alors une chaîne MCMC de longueur N = L + n , seuls π 1 , π 2 , … , π n sont pertinents pour mon approximation postérieure, et n doit être suffisamment grand.
Si j'inclus certains des (c'est-à-dire des réalisations avant que la distribution invariante ne soit atteinte) dans le calcul de l'approximation du postérieur, alors ce sera '' bruyant ''.
Je connais la longueur de la chaîne MCMC , mais sans connaissance du L , c'est-à-dire l'étape où je suis sûr d'échantillonner à partir de la distribution limite, je ne peux pas être sûr que je n'ai pas inclus de bruit, ni assurez-vous de n = N - L , la taille de mon échantillon à partir de la distribution limite, en particulier, je ne peux pas être sûr s'il est `` assez grand ''.
Donc, pour autant que je sache, cette valeur de est d'une importance critique pour la qualité d'approximation du postérieur (exclusion du bruit et d'un grand échantillon de celui-ci) .
Existe-t-il des moyens de trouver une estimation raisonnable pour lorsque j'applique MCMC?
(*) Je pense que, en général, dépendra de la valeur initiale x 1 .