Tutoriels sur les modèles de sujet et LDA

8

J'aimerais savoir si vous avez de bons tutoriels (rapides et simples) sur les modèles de sujet et LDA, enseignant intuitivement comment définir certains paramètres, ce qu'ils signifient et si possible, avec de vrais exemples.

pedrobisp
la source
Pas une réponse directe et pas des tutoriels non plus, mais si vous êtes intéressé par les modèles hiérarchiques, vous pouvez trouver ma réponse récente sur le sujet utile (une collection de documents de recherche).
Aleksandr Blekh
2
Généralement, les questions qui demandent simplement des ressources hors site sont considérées comme hors sujet. Vous pouvez peut-être affiner ce que vous recherchez dans un didacticiel. Que savez-vous, que voulez-vous savoir, voulez-vous du code dans une langue particulière, etc.
Sean Owen

Réponses:

9

Si vous travaillez dans R, le didacticiel de Carson Sievert sur l'utilisation de LDA pour modéliser des sujets dans les critiques de films est un excellent point de départ:

http://cpsievert.github.io/LDAvis/reviews/reviews.html

Ce didacticiel utilise LDAvis, une visualisation interactive des distributions de sujets et de mots qui peut vraiment aider l'intuition.

De plus, bien qu'elles ne soient pas courtes, les conférences de David M. Blei sur les modèles de sujet sont une excellente ressource pour comprendre la signification des paramètres: http://videolectures.net/mlss09uk_blei_tm/

Jeremy Salfen
la source
7

Je recommande fortement ce tutoriel: Premiers pas avec la modélisation de sujets et MALLET

Voici quelques liens supplémentaires pour vous aider à démarrer ...

Bons documents d'introduction (y compris des liens vers des documents de recherche): http://www.cs.princeton.edu/~blei/topicmodeling.html

Logiciel:

Encore plus ici sur le blog Estimations biaisées: Liste de lecture des modèles de sujets

Charlie Greenbacker
la source
1

Je suggère d'essayer le didacticiel Gensim de Machine Learning Plu . Il vous donnera un aperçu holistique de la PNL et de la LDA, y compris: comment pré-traiter vos données, effectuer l'ingénierie des fonctionnalités et appliquer la LDA.

Argyris
la source