J'ai cette confusion sur la règle Armijo utilisée dans la recherche en ligne. Je relisais la recherche de ligne de suivi, mais je n'ai pas compris de quoi s'agissait cette règle Armijo. Quelqu'un peut-il expliquer ce qu'est la règle d'Armijo? Le wikipedia ne semble pas bien expliquer. Merci
optimization
user34790
la source
la source
Réponses:
Une fois que vous avez obtenu une direction de descente pour votre fonction objectif f ( x ) , vous devez choisir une "bonne" longueur de pas. Vous ne voulez pas faire un pas trop grand pour que la fonction à votre nouveau point soit plus grande que votre point actuel. Dans le même temps, vous ne voulez pas faire votre pas trop petit de telle sorte qu'il faut une éternité pour arriver à converger.p f(x)
L'état d'Armijo suggère essentiellement qu'une "bonne" longueur de pas est telle que vous avez "une diminution suffisante" de à votre nouveau point. La condition est mathématiquement énoncée comme f ( x k + α p k ) ≤ f ( x k ) + β α ∇ f ( x k ) T p k où p k est une direction de descente à x k et β ∈ ( 0 , 1 ) .f
L'intuition derrière cela est que la valeur de la fonction au nouveau point devrait être sous la "ligne tangente" réduite à x k dans la direction de p k . Voir le livre de Nocedal & Wright "Numerical Optimization". Dans le chapitre 3, il y a une excellente description graphique de la condition de diminution suffisante d'Armijo.f(xk+αpk) xk pk
la source
Cinq ans plus tard, cette question est toujours d'actualité.
Ici (pages 16 et 17), vous pouvez trouver une excellente explication, y compris un algorithme.
la source