Quelle est la différence entre la distribution prédictive postérieure et postérieure?

31

Je comprends ce qu'est un postérieur, mais je ne sais pas ce que ce dernier signifie?

En quoi les 2 sont-ils différents?

Kevin P Murphy a indiqué dans son manuel, Machine Learning: a Probabilistic Perspective , qu'il s'agit d'un «état de croyance interne». Qu'est-ce que cela signifie vraiment? J'avais l'impression qu'un prieur représente votre croyance ou votre parti pris internes, où vais-je me tromper?

UN D
la source

Réponses:

36

La simple différence entre les deux est que la distribution postérieure dépend du paramètre inconnu , c'est-à-dire que la distribution postérieure est: où est la constante de normalisation.θ

p(θ|X)=c×p(X|θ)p(θ)
c

Alors que d'autre part, la distribution prédictive postérieure ne dépend pas du paramètre inconnu car il a été intégré, c'est-à-dire que la distribution prédictive postérieure est: θ

p(X|X)=Θc×p(X,θ|X)θ=Θc×p(X|θ)p(θ|X)θ

où est une nouvelle variable aléatoire non observée et est indépendante de .XX

Je ne m'attarderai pas sur l'explication de la distribution postérieure puisque vous dites que vous la comprenez mais la distribution postérieure "est la distribution d'une quantité inconnue, traitée comme une variable aléatoire, conditionnelle aux preuves obtenues" (Wikipedia). Donc, fondamentalement, c'est la distribution qui explique votre paramètre inconnu et aléatoire.

D'un autre côté, la distribution prédictive postérieure a une signification complètement différente en ce qu'elle est la distribution des futures données prédites en fonction des données que vous avez déjà vues. Ainsi, la distribution prédictive postérieure est essentiellement utilisée pour prédire de nouvelles valeurs de données.

Si cela aide, voici un exemple de graphique d'une distribution postérieure et d'une distribution prédictive postérieure:

entrez la description de l'image ici

entrez la description de l'image ici

Jinhua Wang
la source
3
Ce graphique de distribution prédictive postérieure a besoin de nouvelles étiquettes d'axe et d'une légende ou quelque chose. Je comprends l'idée parce que je sais ce qu'est une distribution prédictive postérieure, mais quelqu'un qui vient de le découvrir pourrait être sérieusement confus.
Cyan
Merci @BabakP pourriez-vous également me montrer quelle distribution vous avez utilisée pour tracer le pmf de thêta et P (x * | thêta)
AD
... parce que je voudrais travailler sur l'exemple complet.
AD
Je viens de prétendre que mon postérieur était un Beta (3,2). Je n'ai rien fait. Mais bien sûr, si vous voulez un exemple, supposez que la probabilité est un binôme (n, p) et que l'a priori sur p est un bêta (a, b), alors vous devriez pouvoir obtenir que le postérieur est à nouveau une distribution bêta .
De plus, cette prédiction postérieure n'est pas facile à déduire. Je viens de saisir un graphique à partir d'un code de processus gaussien que j'ai écrit pour un prédictif postérieur GP. Et avec cela dit, ce tracé prédictif postérieur et postérieur ci-dessus ne correspond pas réellement au postérieur montré, ils sont tous les deux arbitraires.
11

La distribution prédictive est généralement utilisée lorsque vous avez appris une distribution postérieure pour le paramètre d'une sorte de modèle prédictif. Par exemple, dans la régression linéaire bayésienne, vous apprenez une distribution a posteriori sur le paramètre w du modèle y = wX compte tenu de certaines données observées X.
Ensuite, lorsqu'un nouveau point de données invisible * * entre, vous souhaitez trouver la distribution sur les prédictions possibles y * étant donné la distribution postérieure de w que vous venez d'apprendre. Cette distribution sur les y * possibles étant donné la postérieure de w est la distribution de prédiction.

user1893354
la source
5

Ils se réfèrent à des distributions de deux choses différentes.

La distribution postérieure fait référence à la distribution du paramètre , tandis que la distribution postérieure prédictive (PPD) fait référence à la distribution des futures observations de données .

SPMQET
la source