Analyse bayésienne non paramétrique en R

17

Je suis à la recherche d'un bon tutoriel sur le clustering des données en Rutilisant le processus de dirichlet hiérarchique (HDP) (l'une des méthodes bayésiennes non paramétriques récentes et populaires).

Il existe DPpackage(à mon humble avis, le plus complet de tous ceux disponibles) Rpour l'analyse bayésienne non paramétrique. Mais je ne parviens pas à comprendre R Newssuffisamment les exemples fournis dans ou dans le manuel de référence du package pour coder HDP.

Toute aide ou pointeur est apprécié.

Une implémentation C ++ de HDP pour la modélisation de sujet est disponible ici (veuillez regarder en bas pour le code C ++)

suncoolsu
la source

Réponses:

13

Voici quelques ressources en ligne que j'ai trouvées intéressantes sans entrer dans les détails (et je ne suis pas un spécialiste de ce sujet):

La référence définitive semble être

N. Hjort, C. Holmes, P. Müller et S. Walker, éditeurs. Non paramétrique bayésien . Numéro 28 de la série Cambridge en mathématiques statistiques et probabilistes. Cambridge University Press, 2010.

À propos de R, il semble y avoir d'autres packages à explorer si le DPpackage ne correspond pas à vos besoins, par exemple dpmixsim , BHC ou mbsc sur Rseek.org .

chl
la source
Je vous remercie. En fait, j'avais juste besoin de pointeurs pour le package R. J'apprécie votre serviabilité! Au fait, le livre est génial.
suncoolsu
Cependant, j'attendrai que quelqu'un me pointe vers un package R ou un tutoriel qui montre comment faire de la modélisation basée sur HDP dans R.
suncoolsu
@suncoolsu Je n'ai jamais essayé ces packages; donc ma contribution est juste une recherche sur Google (parce que je suis intéressé à utiliser HDP à l'avenir, mais je n'ai pas le temps pour le moment - c'est la raison pour laquelle j'ai fait ma réponse CW). Je suppose que quelqu'un plus habitué à ces méthodes fera des remarques perspicaces.
chl