Diagnostic de convergence Gelman et Rubin, comment généraliser pour travailler avec des vecteurs?

14

Le diagnostic Gelman et Rubin est utilisé pour vérifier la convergence de plusieurs chaînes mcmc exécutées en parallèle. Il compare la variance intra-chaîne à la variance inter-chaîne, l'exposition est ci-dessous:

Étapes (pour chaque paramètre):

  1. Exécutez m ≥ 2 chaînes de longueur 2n à partir de valeurs de départ surdispersées.
  2. Jeter les n premiers tirages de chaque chaîne.
  3. Calculez la variance intra-chaîne et inter-chaîne.
  4. Calculez la variance estimée du paramètre sous la forme d'une somme pondérée de la variance intra-chaîne et inter-chaîne.
  5. Calculez le facteur de réduction d'échelle potentiel.
  6. Élément de liste

Je veux utiliser cette statistique mais les variables avec lesquelles je veux l'utiliser sont des vecteurs aléatoires.

Est-il judicieux de prendre la moyenne des matrices de covariance dans ce cas?

Tim
la source

Réponses:

17

Une recommandation: il suffit de calculer le PSRF séparément pour chaque composant scalaire

L'article original de Gelman & Rubin [1], ainsi que le manuel Bayesian Data Analysis de Gelman et al. [2], recommande de calculer séparément le facteur de réduction d'échelle potentiel (PSRF) pour chaque paramètre scalaire d'intérêt. Pour déduire la convergence, il est alors nécessaire que tous les PSRF soient proches de 1. Peu importe que vos paramètres soient interprétés comme des vecteurs aléatoires, leurs composants sont des scalaires pour lesquels vous pouvez calculer des PSRF.

Brooks & Gelman [3] ont proposé une extension multivariée du PSRF, que j'examine dans la section suivante de cette réponse. Cependant, pour citer Gelman & Shirley [4]:

[...] ces méthodes peuvent parfois représenter une surpuissance: les paramètres individuels peuvent être bien estimés même si la convergence approximative des simulations d'une distribution multivariée peut prendre très longtemps.

Alternative: extension multivariée par Brooks & Gelman

WB

V^=n1nW+1nB,
nV^,W
R^=maxaaTV^aaTWa=n1n+(m+1m)λ1,
mλ1W1V^/nλ10nR^

Les références

[1] Gelman, Andrew et Donald B. Rubin. "Inférence de la simulation itérative utilisant plusieurs séquences." Science statistique (1992): 457-472.

[2] Gelman, Andrew et al. Analyse des données bayésiennes. Presse CRC, 2013.

[3] Brooks, Stephen P. et Andrew Gelman. "Méthodes générales de surveillance de la convergence des simulations itératives." Journal of Computational and Graphical Statistics 7.4 (1998): 434-455.

[4] Gelman, Andrew et Kenneth Shirley. "Inférence des simulations et surveillance de la convergence". (Chapitre 6 dans Brooks, Steve, et al., Éd. Handbook of Markov Chain Monte Carlo. CRC Press, 2011.)

Tous les articles à l'exception du manuel [2] sont disponibles sur le site Web d' Andrew Gelman . Site Web d' Andrew Gelman .

Juho Kokkala
la source