L '"optimisation convexe en ligne" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) généralise les algorithmes d'apprentissage de la "minimisation des regrets" d'un paramètre linéaire à un paramètre convexe et donne un bon "regret externe" . Existe-t-il une généralisation similaire pour le regret interne? (Je ne suis pas totalement sûr de ce que cela signifierait exactement.)
19
Réponses:
Essayez «l'apprentissage sans regret dans les jeux convexes» par Gordon, Greenwald et Marks http://portal.acm.org/citation.cfm?id=1390202 . Son résumé sonne comme s'il répondait probablement à votre question, ou au moins quiconque répondant à cette question citerait ou serait cité par cet article.
la source
Cet article d'Avrim Blum met en évidence un lien entre les regrets externes et internes. Selon son résumé, le regret externe est une mesure de la façon dont un algorithme est comparé à la meilleure action fixe, tandis que le regret interne se compare à la meilleure variation de cette méthode (meilleure permutation fixe des sorties, comme le signalement de la classe A chaque fois que l'algorithme d'origine a signalé classe B).
la source