Questions marquées «online-learning»

19
Regret interne dans l'optimisation convexe en ligne

L '"optimisation convexe en ligne" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) généralise les algorithmes d'apprentissage de la "minimisation des regrets" d'un paramètre linéaire à un paramètre convexe et donne un bon "regret externe" . Existe-t-il une généralisation...

19
Quels sont les meilleurs compromis temps / erreur possibles pour une solution approximative de programmes linéaires?

Pour le concret, considérons le LP pour résoudre un jeu à somme nulle à deux joueurs où chaque joueur a actions. Supposons que chaque entrée de la matrice de gains soit au plus 1 en valeur absolue. Par souci de simplicité, ne faisons aucune hypothèse de rareté.AnnnAAA Supposons que le runtime soit...

19
Le problème de Warren Buffett

Voici une abstraction d'un problème d'apprentissage en ligne / bandit sur lequel j'ai travaillé l'été. Je n'ai jamais vu un problème comme celui-ci auparavant, et cela semble assez intéressant. Si vous connaissez un travail connexe, j'apprécierais les références. Le problème Le réglage est celui...