La nature discrète du DP le rend impropre à des applications générales dans les paramètres non paramétriques bayésiens, mais il est bien adapté au problème de placement des a priori sur les composants du mélange dans la modélisation des mélanges.
Cette citation est extraite des processus hiérarchiques de Dirichlet (Teh, et al, (2006) ) et je cherchais une explication sur ce que cela signifie. Le terme non paramétrique bayésien semble être un terme trop vague pour que je puisse comprendre à quoi l'auteur fait référence.
Teh, YW, Jordan, MI, Beal, MJ, Blei, DM (2006): "Hierarchical Dirichlet Processes". Journal de l'American Statistical Association , 101, pp. 1566-1581.
Réponses:
Avec la probabilité un, les réalisations d'un processus de Dirichlet sont des mesures de probabilité discrètes. Une preuve rigoureuse se trouve dans
Blackwell, D. (1973). "Discreteness of Ferguson Selections", The Annals of Statistics, 1 (2): 356–358.
La représentation de rupture de bâton du processus de Dirichlet rend cette propriété transparente.
Dessinez indépendant , pour .Bi∼Beta(1,c) i≥1
Définissez et , pour .P1=B1 Pi=Bi∏i−1j=1(1−Bj) i>1
Dessinez indépendant , pour .Yi∼F i≥1
Sethuraman a prouvé que la fonction de distribution discrète est une réalisation de un processus de Dirichlet avec le paramètre de concentration et centrée à la fonction de répartition .
L' espérance de ce processus de Dirichlet est simplement , et cela peut être la fonction de distribution d'une variable aléatoire continue. Mais, si les variables aléatoires forment un échantillon aléatoire de ce processus de Dirichlet, l'attente postérieure est une mesure de probabilité qui attribue une masse positive à chaque point d'échantillon.F X1,…,Xn
En ce qui concerne la question d'origine, vous pouvez voir que le processus de Dirichlet simple peut ne pas convenir pour modéliser certains problèmes de paramètres non paramétriques bayésiens, comme le problème de l'estimation de la densité bayésienne, mais des extensions appropriées du processus de Dirichlet sont disponibles pour gérer ces cas.
la source