Quand dois-je utiliser l'apprentissage par renforcement par rapport au contrôle PID?
Lors de la conception de solutions à des problèmes tels que l' atterrissage lunaire sur OpenAIGym , l'apprentissage par renforcement est un moyen tentant de donner à l'agent un contrôle d'action adéquat pour réussir son atterrissage. Mais dans quels cas les algorithmes des systèmes de contrôle,...