Livres sur l'apprentissage par renforcement

9

J'essaie de comprendre l'apprentissage par renforcement depuis un certain temps, mais je ne suis pas en mesure de visualiser comment écrire un programme d'apprentissage par renforcement pour résoudre un problème de grille. Pouvez-vous me suggérer des manuels qui pourraient m'aider à construire une conception claire de l'apprentissage par renforcement?

girl101
la source
S'il vous plaît se référer à openai également son un bon endroit pour apprendre l'apprentissage de renforcement à partir de python essentiellement
Vineet Kothari

Réponses:

7

Voici quelques bonnes références sur l'apprentissage par renforcement:

Classique

Sutton RS, Barto AG. Apprentissage par renforcement: une introduction. Cambridge, Mass: A Bradford Book; 1998. 322 p.

Le projet de la deuxième édition est disponible gratuitement: http://incompleteideas.net/book/the-book-2nd.html

Chapitre 21 de Russell / Norvig:

Russell SJ, Norvig P, Davis E. Intelligence artificielle: une approche moderne. Upper Saddle River, NJ: Prentice Hall; 2010.

Plus technique

Szepesvári C. Algorithmes pour l'apprentissage par renforcement. Conférences de synthèse sur l'intelligence artificielle et l'apprentissage automatique. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programmation dynamique et contrôle optimal. 4ème édition. Belmont, Mass.: Athena Scientific; 2007. 1270 p. Le chapitre 6, vol 2 est disponible gratuitement: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Pour des développements plus récents

Wiering M, van Otterlo M, éditeurs. Apprentissage par renforcement. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Disponible sur: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Prise de décision en cas d'incertitude: théorie et application. 1 édition. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Apprentissage par renforcement multi-agents

Buşoniu L, Babuška R, BD Schutter. Apprentissage par renforcement multi-agents: un aperçu. Dans: Srinivasan D, Jain LC, éditeurs. Innovations dans les systèmes et applications multi-agents - 1. Springer Berlin Heidelberg; 2010 p. 183-221. Disponible sur: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Apprentissage automatique multi-agents: une approche de renforcement. Hoboken, New Jersey: Wiley; 2014.

Vidéos / Cours

Je suggère également un cours David Silver sur YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

Juan Leni
la source
7

Il existe un cours en ligne gratuit sur l'apprentissage par renforcement par Udacity. Vérifier: Apprentissage automatique: Apprentissage par renforcement

Sreejithc321
la source
Il convient de mentionner qu'un problème de réseau mondial est présenté dans le cadre de ce cours.
Neil Slater
oui, j'ai vu ça, mais pas assez pour coder le même
girl101
4

J'ai vraiment apprécié Reinforcement Leraning: une introduction de Richard Sutton. Il fournit une très belle vue unificatrice sur RL, bien qu'il ne mentionne pas les approches les plus récentes (c'est de 1998).

Martin Modrák
la source
en fait, je voulais voir un problème de monde de grille résolu en calculant sur un stylo et du papier, car cela m'aiderait à comprendre le concept, à moins que je puisse comprendre le concept que je ne peux pas coder (valeur spécialement
itérée