L'algorithme de bandit le plus connu est la borne de confiance supérieure (UCB) qui a popularisé cette classe d'algorithmes. Depuis lors, je suppose qu'il existe désormais de meilleurs algorithmes. Quel est le meilleur algorithme actuel (en termes de performances empiriques ou de limites...