Considérons l'équation différentielle suivante où est l'état et la variable de contrôle. La solution est donnée par où est l'état initial donné.
Considérons maintenant le programme suivant où \ rho> 0 indique la préférence temporelle, V (\ cdot) est la valeur et F (\ cdot) une fonction objective. Une application économique classique est le modèle Ramsey-Cass-Koopmans de croissance optimale. L'équation de Hamilton-Jacobi-Bellman est donnée par \ begin {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ forall t \ in [0, \ infty). \ end {align}
Dire que je l' ai résolu le HJB pour . Le contrôle optimal est alors donné par
L' article du wiki dit
... mais lorsqu'elle est résolue sur l'ensemble de l'espace d'état, l'équation HJB est une condition nécessaire et suffisante pour un optimum.
Dans Bertsekas (2005) Dynamic Programming and Optimal Control , Vol 1, 3e éd., Dans la proposition 3.2.1, il déclare que la résolution de est la fonction optimale de coût à parcourir et que le u ^ * associé est optimal. Cependant, il le déclare explicitement comme un théorème de suffisance.
En fait, je veux juste m'assurer que si j'ai résolu le HJB et récupéré l'état et les trajectoires de contrôle associés, je n'ai pas à me soucier de conditions d'optimalité supplémentaires.
Solution
Je tente
Je pense que j'ai pu dériver les conditions nécessaires du principe maximum par l'équation HJB elle-même.
Définissez l'hamiltonien
alors nous avons
qui est
Définissez une fonction arbitraire avec . Maintenant, corrigez
où est un paramètre. Branchez le terme dans l'hamiltonien maximisé qui donne
À nous avons la solution optimale. Différenciez donc pour obtenir une condition de premier ordre
Définissez maintenant la variable adjointe avec
Différencier au fil du temps
et notez que
Branchez tout dans la foc qui donne
C'est à peu près ça. La résolution du HJB est donc en effet nécessaire et suffisante (omise ici) pour l'optimalité. Quelqu'un devrait l'ajouter au wiki. Cela pourrait faire gagner du temps aux personnes qui pensent à de tels problèmes (ce ne sera pas beaucoup je pense).
Cependant, la condition de transversalité est manquante.
II Tentative
Définissez la fonction de gain
Notez que par définition de . Ajoutez le terme neutre à la fonction de gain
Intégration par des parties du terme droit sur les valeurs rhs
Remplacez ce terme
Définissez
ce qui donne
FOC pour maximum
Puisque et sont pas contraints, nous devons avoir
Réponses:
(Cela devrait peut-être être considéré comme un commentaire.)
Si vous avez résolu l'équation HJB, il suffit d'obtenir la solution optimale. Vous n'avez donc pas "à vous préoccuper d'autres conditions d'optimalité", ce qui, je crois, semble répondre à votre question.
Il semble que vous vous préoccupiez de la composante "nécessaire" du théorème. Le côté nécessité de l'énoncé est le suivant: s'il existe une solution optimale, il doit exister une solution à l'équation HJB.
Je n'ai pas travaillé avec ce problème particulier, mais la réponse en général est que nous ne nous attendons pas à avoir une fonction V. différentiable Par conséquent, nous n'avons pas de solution à l'équation telle qu'elle est énoncée. Au lieu de cela, nous devons examiner les dérivés généralisés et convertir l'équation HJB en une inégalité. Dans ce cas, vous pouvez obtenir une «solution de viscosité». Si nous étendons l'utilisation de dérivés généralisés, il peut être possible de prouver qu'une telle solution existe toujours. En jetant un coup d'œil à vos preuves, elles n'aideront pas aux conditions de nécessité, car vous supposez une différentiabilité.
la source