DeepMind déclare que son réseau Q profond (DQN) a été en mesure d'adapter continuellement son comportement tout en apprenant à jouer à 49 jeux Atari.
Après avoir appris tous les jeux avec le même réseau neuronal, l'agent était-il en mesure de les jouer tous à des niveaux `` surhumains '' simultanément (chaque fois qu'il était présenté au hasard avec l'un des jeux) ou ne pouvait-il être bon que pour un jeu à la fois parce que la commutation besoin d'un ré-apprentissage?
Réponses:
La commutation a nécessité une réapprentissage.
Notez également que :
et
la source
La commutation nécessite un réapprentissage, le réseau n'avait pas un seul ensemble de poids qui lui permettait de bien jouer à tous les jeux. Cela est dû au problème catastrophique de l'oubli.
Cependant, un travail récent a été fait pour surmonter ce problème:
"Surmonter l'oubli catastrophique dans les réseaux de neurones", 2016
Papier: https://arxiv.org/pdf/1612.00796v1.pdf
la source