Mise à jour d'un facteur Bayes

9

Un facteur bayésien est défini dans les tests bayésiens d'hypothèse et de sélection du modèle bayésien par le rapport de deux probabilités marginales: pour un échantillon iid et les densités d'échantillonnage respectives et , avec les a priori correspondants et , le facteur Bayes pour comparer les deux modèles est Un livre que je suis en train de lire contient l'étrange déclaration que le facteur Bayes ci-dessus(x1,,xn)f1(x|θ)f2(x|η)π1π2

B12(X1,,Xn)=defm1(X1,,Xn)m2(X1,,Xn)=defje=1nF1(Xje|θ)π1(θ)je=1nF2(Xje|η)π2(η)
B12(X1,,Xn) est "formé en multipliant les facteurs individuels [facteurs Bayes] ensemble" (p.118). Ceci est formellement correct si l'on utilise la décomposition mais je ne vois aucun avantage de calcul dans cette décomposition comme mise à jour par nécessite le même effort de calcul que le calcul d'origine de
B12(X1,,Xn)=m1(X1,,Xn)m2(X1,,Xn)=m1(Xn|X1,,Xn-1)m2(Xn|X1,,Xn-1)×m1(Xn-1|Xn-2,,X1)m2(Xn-1|Xn-2,,X1)××m1(X1)m2(X1)
m1(Xn|X1,,Xn-1)m2(Xn|X1,,Xn-1)
m1(X1,,Xn)m2(X1,,Xn)
en dehors des exemples de jouets artificiels.

Question: Existe - t-il un moyen générique et efficace de mettre à jour le facteur Bayes de vers \ mathfrak {B} _ {12} (x_1, \ ldots, x_ {n + 1}) qui ne nécessite pas de recalculer les marginaux entiers m_1 (x_1, \ ldots, x_n) et m_2 (x_1, \ ldots, x_n) ?B12(X1,,Xn)B12(X1,,Xn+1)m1(X1,,Xn)m2(X1,,Xn)

Mon intuition est que, outre les filtres à particules, qui procèdent effectivement à l'estimation des facteurs de Bayes B12(X1,,Xn) une nouvelle observation à la fois, il n'y a pas de moyen naturel de répondre à cette question .

Xi'an
la source
1
Il ne me semble pas clair que la formulation implique nécessairement une factorisation séquentielle , car les observations sont iid. Au cours de ses études supérieures, un professeur a mentionné que le produit implique que l'on pouvait utiliser des approximations asymptotiques pour les analyses bayésiennes, mais étrangement cela n'avait pas pris (sarcasme). Peut-être que le livre pourrait faire allusion à cela?
Cliff AB
@CliffAB: Oui, vous pouvez réécrire la probabilité en tant que moyenne de termes individuels, convergeant vers une distance de Kullback-Leibler de la vraie distribution. Mais je ne pense pas que ce soit le cas, même si le livre n'est pas assez clair pour garder toutes les options ouvertes.
Xi'an
1
Je crois qu'il y a une faute de frappe dans la deuxième équation affichée: devrait-il être dans le deuxième facteur sur la deuxième ligne? m1(Xn-1|Xn-1,,X1)
jochen

Réponses:

4

On peut supposer que le but d'une équation récursive pour le facteur Bayes serait lorsque vous avez déjà calculé le facteur Bayes pour points de données et que vous souhaitez pouvoir le mettre à jour avec un point de données supplémentaire. Il semble qu'il soit possible de le faire sans recalculer les marginaux du vecteur de données précédent, tant que la forme de la fonction postérieure est connue. En supposant que nous connaissons la forme de cette fonction (et en supposant des données IID comme dans votre question), la densité prédictive peut être écrite comme:nπn

m(Xn+1|X1,...,Xn)=ΘF(Xn+1|θ)πn(θ|X1,...,Xn).

Vous avez donc:

m(X1,...,Xn+1)=m(X1,...,Xn)ΘF(Xn+1|θ)πn(θ|X1,...,Xn).

En comparant deux classes de modèle via le facteur de Bayes, nous obtenons alors l'équation récursive:

B12(X1,...,Xn+1)=B12(X1,...,Xn)Θ1F(Xn+1|θ)π1,n(θ|X1,...,Xn)Θ2F(Xn+1|θ)π2,n(θ|X1,...,Xn).

Cela implique toujours l'intégration sur la plage de paramètres, donc je suis d'accord avec votre avis qu'il ne semble pas y avoir d'avantage de calcul par rapport au simple recalcul du facteur Bayes via la formule initiale que vous donnez. Néanmoins, vous pouvez voir que cela ne vous oblige pas à recalculer les marginaux pour le vecteur de données précédent. (Au lieu de cela, nous calculons les densités prédictives du nouveau point de données conditionnelles aux données précédentes, sous chacune des classes de modèle.) Comme vous, je ne vois vraiment aucun avantage de calcul de cela, sauf s'il arrive que cette formule intégrale se simplifie facilement. En tout cas, je suppose que cela vous donne une autre formule pour mettre à jour le facteur Bayes.

Ben - Réintègre Monica
la source
Je vous remercie. Il est vrai que les marginaux n'ont pas besoin d'être recalculés, stricto sensu , mais la quantité de calcul semble être la même, comme vous le remarquez.
Xi'an
Le seul avantage auquel je peux penser est que, comme nous n'intégrons désormais que sur une seule densité (plutôt que le produit de densités), l'intégrande sera moins volatile, et cette dernière formule pourrait donc faciliter la prévention des problèmes de débordement dans calcul. C'est peut-être un gros tout de même. n
Ben - Réintègre Monica le