Qu'est-ce que le «replay d'expérience» et quels sont ses avantages?
J'ai lu DeepMind Atari Google document et je suis en train de comprendre le concept de « replay expérience ». La relecture d'expérience apparaît dans de nombreux autres articles d'apprentissage par renforcement (en particulier, le papier AlphaGo), donc je veux comprendre comment cela fonctionne....