Dans le rapport technique sur Galahad [1], les auteurs déclarent, dans le contexte des problèmes généraux de programmation non linéaire,
À notre avis, il n'y avait jamais eu vraiment de doute que les méthodes SQP [programmation quadratique séquentielle] seraient plus efficaces [que les méthodes lagrangiennes augmentées] à long terme ...
Quelle pourrait être la base de cette croyance? C'est-à-dire, y a-t-il des résultats théoriques qui suggèrent que les méthodes SQP devraient être plus rapides / plus fiables que les méthodes Lagrangiennes augmentées?
[1] Galahad, une bibliothèque de packages Fortran 90 thread-safe pour l'optimisation non linéaire à grande échelle, par Gould, Orban et Toint
la source
En termes d'itérations externes, SQP devrait gagner car il inclut des informations dérivées secondes, contrairement aux méthodes lagrangiennes augmentées comme ADMM.
Cependant, une chose à garder à l'esprit est que chaque itération de ces méthodes implique la résolution d'un système linéaire, donc pour faire une comparaison équitable, vous devez tenir compte de la facilité de résolution de ces systèmes.
Pour les méthodes SQP, vous résolvez quelque chose comme où est la Hesse (ou son approximation) qui n'est généralement disponible qu'implicitement en termes d'action sur les vecteurs et est le gradient. La Hesse contient non seulement , mais aussi une combinaison d'autres matrices et inverses matricielles provenant de la linéarisation des contraintes et de la régularisation.
Le préconditionnement des Hessians est une entreprise assez délicate et est beaucoup moins étudié que le préconditionnement des problèmes ultérieurs. Une méthode standard consiste à approximer l'inverse de Hesse avec L-BFGS, mais cela est d'une efficacité limitée lorsque l'inverse de Hesse est de haut rang. Une autre méthode populaire consiste à approximer la toile de jute comme une somme d'une matrice de bas rang plus une matrice facile à inverser, mais cela a également une efficacité limitée pour les problèmes difficiles. D'autres techniques d'estimation populaires de Hesse sont basées sur des approximations éparses, mais les problèmes de continuum ont souvent des Hessois qui ont de mauvaises approximations éparses.
la source