La simple différence entre les deux est que la distribution postérieure dépend du paramètre inconnu , c'est-à-dire que la distribution postérieure est:
où est la constante de normalisation.θp ( θ | x ) = c × p ( x | θ ) p ( θ )
c
Alors que d'autre part, la distribution prédictive postérieure ne dépend pas du paramètre inconnu car il a été intégré, c'est-à-dire que la distribution prédictive postérieure est:
θp ( x∗| x)= ∫Θc × p ( x∗, θ | x ) dθ = ∫Θc × p ( x∗| θ)p( θ | x ) dθ
où est une nouvelle variable aléatoire non observée et est indépendante de .X∗X
Je ne m'attarderai pas sur l'explication de la distribution postérieure puisque vous dites que vous la comprenez mais la distribution postérieure "est la distribution d'une quantité inconnue, traitée comme une variable aléatoire, conditionnelle aux preuves obtenues" (Wikipedia). Donc, fondamentalement, c'est la distribution qui explique votre paramètre inconnu et aléatoire.
D'un autre côté, la distribution prédictive postérieure a une signification complètement différente en ce qu'elle est la distribution des futures données prédites en fonction des données que vous avez déjà vues. Ainsi, la distribution prédictive postérieure est essentiellement utilisée pour prédire de nouvelles valeurs de données.
Si cela aide, voici un exemple de graphique d'une distribution postérieure et d'une distribution prédictive postérieure:
La distribution prédictive est généralement utilisée lorsque vous avez appris une distribution postérieure pour le paramètre d'une sorte de modèle prédictif. Par exemple, dans la régression linéaire bayésienne, vous apprenez une distribution a posteriori sur le paramètre w du modèle y = wX compte tenu de certaines données observées X.
Ensuite, lorsqu'un nouveau point de données invisible * * entre, vous souhaitez trouver la distribution sur les prédictions possibles y * étant donné la distribution postérieure de w que vous venez d'apprendre. Cette distribution sur les y * possibles étant donné la postérieure de w est la distribution de prédiction.
la source
Ils se réfèrent à des distributions de deux choses différentes.
La distribution postérieure fait référence à la distribution du paramètre , tandis que la distribution postérieure prédictive (PPD) fait référence à la distribution des futures observations de données .
la source