Programmation d'un robot suiveur de ligne avec apprentissage par renforcement
J'envisage de programmer un robot suiveur de ligne en utilisant des algorithmes d'apprentissage par renforcement. La question que je réfléchis est de savoir comment puis-je obtenir l'algorithme pour apprendre à naviguer à travers un chemin arbitraire? Après avoir suivi le livre Sutton & Barto...