Plus précisément, je demande des ressources pour en savoir plus sur les systèmes d'apprentissage automatique qui peuvent mettre à jour leurs réseaux de croyances respectifs (ou équivalent) pendant le fonctionnement. J'en ai même rencontré quelques-uns, même si je n'ai pas réussi à les mettre en signet.
Comme vous pouvez l'imaginer, c'est un sujet assez difficile à rechercher sur Internet.
Réponses:
La plupart des algorithmes d'apprentissage en ligne proviennent d'au moins une de ces lignées:
le perceptron
Les perceptrons de pointe sont l' algorithme passif-agressif , le perceptron structuré et leurs nombreuses variétés.
Le vannage
Le vannage a été reformulé en tant que méthodes de gradient exponentiées et peut également être appliqué à des problèmes structurés . Il existe également des variétés qui traitent directement de la régularisation L1 (pour garantir la rareté), comme SMIDAS .
Descente de gradient stochastique
La descente de gradient stochastique se produit lorsque vous appliquez l'optimisation en ligne à un problème éventuellement par lots. Les algorithmes de pointe sont LeSVM , Pegasos de Leon Bottou et de nombreux algorithmes de réseau neuronal peuvent être facilement formés dans ce contexte. Voir le tutoriel theano pour de nombreux exemples. Peut-être que l' EM en ligne convient ici.
filtrage des particules
Ceci est également connu sous le nom d'inférence rao-blackwellized, et il vous permet de mettre à jour un modèle graphique / probabiliste à mesure que davantage de données arrivent. Quelques bons exemples sont les modèles de rubriques en ligne et le didacticiel NIPS sur SMC .
Il y a aussi des problèmes plus larges avec l'apprentissage en ligne, comme la conversion en ligne en lots , les techniques budgétaires pour l'apprentissage en ligne avec des noyaux (comme ce papier , ce papier et ce papier ), de nombreuses saveurs différentes de limites de généralisation, des problèmes de rareté (et aussi l'article de SMIDAS que j'ai cité ci-dessus), le hachage pour économiser de la mémoire et bien d'autres problèmes.
la source
Avrim Blum comme un formidable document d'enquête que je recommanderais de commencer par: "Algorithmes en ligne dans l'apprentissage automatique" http://www.cs.cmu.edu/~avrim/Papers/survey.ps
la source
Si vous cherchez des informations sur la théorie derrière l'apprentissage en ligne, le livre de Cesa-Bianchi et Lugosi est une référence solide.
la source
Il y a un joli tutoriel d'ICML 2008 par Yoram Singer et Shai Shalev Shwartz sur la théorie et la pratique de l'apprentissage en ligne.
la source
Apprentissage automatique - Supports de cours - Stanford http://www.stanford.edu/class/cs229/materials.html
Conférences vidéo sur l'apprentissage automatique et l'intelligence artificielle http://freescienceonline.blogspot.com/2007/07/machine-learning-and-artificial.html
Processus gaussiens pour l'apprentissage automatique http://www.gaussianprocess.org/gpml/
la source