Il y a beaucoup de questions (comme celle-ci ) sur une ambiguïté avec la formule bayésienne en cas continu.
Souvent, la confusion vient du fait que la définition de la distribution conditionnelle est expliquée comme étant fonction de la donnée fixe .
Parallèlement à cela, il existe un principe d'équivalence stipulant que la probabilité peut être écrite comme:
Alors pourquoi ne pas utiliser la règle de Bayes pour les distributions sous la forme suivante:
pour souligner que nous avons affaire à des fonctions de étant donné données observées x , et que le terme respectif est vraisemblance (au moins, en commençant par L )?
Est-ce une question de tradition ou y a-t-il quelque chose de plus fondamental dans cette pratique?
Réponses:
Il y a deux résultats de base de la probabilité qui sont à l'œuvre dans le théorème de Bayes. L'un est un moyen de réécrire une fonction de densité de probabilité conjointe :
L'autre est une formule pour calculer une fonction de densité de probabilité conditionnelle :
Le théorème de Bayes assemble simplement ces deux choses ensemble:
Donc, les données et les paramètres sont des variables aléatoires avec pdf communx θ
Cela dit, vous verrez des gens utiliser, comme ici ou ici .
la source
La fonction de vraisemblance est simplement proportionnelle à la densité d'échantillonnage, dans le sens où vous avez pour une constante (bien que vous devriez noter que la probabilité est une fonction du paramètre, pas des données). Si vous souhaitez utiliser cela dans votre expression pour le théorème de Bayes, vous devez inclure la même constante de mise à l'échelle dans le dénominateur:Lx(θ)=k(x)⋅p(x|θ) k(x)>0
Si vous utilisez plutôt la formule que vous avez proposée, vous vous retrouverez avec un noyau de densité postérieure, mais il peut ne pas s'intégrer à un (et donc ce n'est généralement pas une densité).
la source