Je parcourais la documentation de Stan qui peut être téléchargée ici . J'étais particulièrement intéressé par leur implémentation du diagnostic Gelman-Rubin. Le document original Gelman & Rubin (1992) définit le facteur de réduction d'échelle potentiel (PSRF) comme suit:
Soit la ème chaîne de Markov échantillonnée, et qu'il y ait globalement chaînes indépendantes échantillonnées. Soit la moyenne de la ème chaîne, et la moyenne globale. Définissez,
Définir V = ( N - 1 Le PSRF est estimé avec √
La documentation de Stan à la page 349 ignore le terme avec et supprime également le terme multiplicatif ( M + 1 ) / M. Voici leur formule,
L'estimateur de variance est Enfin, la statistique potentiel de réduction d'échelle est définie par R = √
D'après ce que j'ai pu voir, ils ne fournissent pas de référence pour ce changement de formule, et ils n'en discutent pas non plus. Habituellement, n'est pas trop grand et peut souvent être aussi bas que 2 , donc ( M + 1 ) / M ne doit pas être ignoré, même si le terme d f peut être approximé par 1.
D'où vient donc cette formule?
EDIT: J'ai trouvé une réponse partielle à la question "d' où vient cette formule? ", Dans la mesure où le livre Bayesian Data Analysis de Gelman, Carlin, Stern et Rubin (deuxième édition) a exactement la même formule. Cependant, le livre n'explique pas comment / pourquoi il est justifié d'ignorer ces termes?
la source
Réponses:
J'ai suivi le lien spécifique donné pour Gelman et Rubin (1992) et il a σ = n - 1 comme dans les versions ultérieures, bien que σ remplacé par σ
BDA2 et BDA3 (impossible de vérifier maintenant BDA1) ont un exercice avec des indices pour montrer que est une estimation non biaisée de la quantité souhaitée.varˆ+
Gelman & Brooks (1998) a pour équation 1.1 R = m + 1 qui peut être réarrangée comme R
Gelman et Rubin (1992) avaient également le terme avec df comme df / (df-2). Brooks et Gelman (1998) ont une section décrivant pourquoi cette correction de df est incorrecte et définissent (df + 3) / (df + 1). Le paragraphe précédant la section 3.1 de Brooks & Gelman (1998) explique pourquoi (d + 3) / (d + 1) peuvent être supprimés.
Il semble que votre source pour les équations soit postérieure à Brooks & Gelman (1998) comme vous en aviez (d + 3) / (d + 1) et Gelman & Rubin (1992) avaient df / df (-2). Sinon, Gelman et Rubin (1992) et Brooks et Gelman (1998) ont des équations équivalentes (avec des notations légèrement différentes et certains termes sont disposés différemment). BDA2 (Gelman, et al., 2003) n'a plus de termesσ^+Wm−n−1mn
J'espère vraiment que ce n'est pas souvent le cas. Dans les cas où vous souhaitez utiliser split-R^
Référence supplémentaire:
la source