Regret interne dans l'optimisation convexe en ligne

19

L '"optimisation convexe en ligne" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) généralise les algorithmes d'apprentissage de la "minimisation des regrets" d'un paramètre linéaire à un paramètre convexe et donne un bon "regret externe" . Existe-t-il une généralisation similaire pour le regret interne? (Je ne suis pas totalement sûr de ce que cela signifierait exactement.)

Noam
la source
Est-il possible d'ajouter une brève description des regrets internes à la question?
Moritz
Dans les «experts» habituels, définir un regret interne signifierait que rétrospectivement, vous ne voudriez pas passer d'une action à une autre, de manière cohérente tout au long de l'histoire. Le papier Blum-Mansour est probablement la meilleure référence pour les regrets internes et externes: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Noam

Réponses:

9

Essayez «l'apprentissage sans regret dans les jeux convexes» par Gordon, Greenwald et Marks http://portal.acm.org/citation.cfm?id=1390202 . Son résumé sonne comme s'il répondait probablement à votre question, ou au moins quiconque répondant à cette question citerait ou serait cité par cet article.

Warren Schudy
la source
0

Cet article d'Avrim Blum met en évidence un lien entre les regrets externes et internes. Selon son résumé, le regret externe est une mesure de la façon dont un algorithme est comparé à la meilleure action fixe, tandis que le regret interne se compare à la meilleure variation de cette méthode (meilleure permutation fixe des sorties, comme le signalement de la classe A chaque fois que l'algorithme d'origine a signalé classe B).

Alexandre Passos
la source
1
L'article de Blum-Mansour n'est pas dans le cadre de "l'optimisation convexe en ligne", mais plutôt dans le cadre "d'experts" linéaire. Ma question est de savoir si quelque chose de similaire ou un autre algorithme de regret interne direct peut être appliqué dans le cadre convexe.
Noam