Sources pour la théorie algorithmique évolutive des jeux

15

J'utilise le terme de titre dans un sens très vague.

Il y a une quantité importante de travail sur la théorie des jeux évolutifs, y compris ses fondements mathématiques. On m'a recommandé "Jeux évolutionnaires et dynamique des populations", mais je n'y suis pas encore allé.

Il y a également une quantité importante de travail sur la théorie des jeux algorithmiques, qui est un sujet populaire sur ce site.

Ce que j'aimerais voir, c'est un travail qui fasse des déclarations de complexité informatique ou de convergence sur certaines dynamiques évolutives.

Exemples (formulés de façon très lâche):

  1. Compte tenu d'une population et d'un schéma évolutif, peut-on donner un regret probabiliste lié à l'optimalité de population à long terme (par rapport au meilleur individu produit?). Cela semble fortement lié aux ensembles d'experts et aux problèmes de bandits. Qu'en est-il des paramètres non stationnaires?
  2. Étant donné un ensemble de populations d'espèces différentes qui interagissent dans leur environnement, jouant à peu près n'importe quelle sorte de jeu multi-joueurs, quelles déclarations pouvons-nous faire sur la stabilité éventuelle de leurs stratégies ou distributions de stratégies, compte tenu de leurs stratégies évolutives.
  3. Dans tout type d'environnement avec de nombreuses "niches" (une manière trop large de le formuler, je comprends), que ce soit en termes de relation directe avec l'environnement ou en termes de relations avec d'autres espèces, quelles déclarations pouvons-nous faire sur la répartition des populations à travers ces niches.
  4. Tout problème que je n'ai pas posé mais que je devrais - j'y arrive avec peu d'AGT, TCS, algorithmes génétiques, théorie du jeu évolutif ou fond de biologie des populations Je pose mes questions d'un point de vue optimisation / apprentissage automatique / statistiques, qui peut être incorrect ou incomplet.
Elliot JJ
la source

Réponses:

11

C'est l'un des sujets pour lesquels je cherche des connexions depuis un moment. Cependant, ils ne semblent pas tous répandus. Les gens qui travaillent sur la biologie théorique et l'économie qui utilisent l'EGT, s'en tiennent généralement à la théorie des systèmes dynamiques et ne mettent pas la lentille algorithmique. Ainsi, la plupart des résultats sont du style AMath / Physique, et non des algorithmes et du style mathématique discret. Si vous êtes prêt à poursuivre l'approche des systèmes dynamiques, alors il y a une enquête de Hofbauer et Sigmund qui est plus courte et plus récente que leur livre (je le mentionne et quelques commentaires en passant dans une réponse précédente ).

L'un des endroits où la dynamique du réplicateur a été utilisée dans les résultats liés à la complexité est celui de Marcello Pelillo et de ses coauteurs comme heuristique pour résoudre la max-clique (réduire la max-clique à la programmation quadratique, résoudre la programmation quadratique en utilisant la dynamique du réplicateur comme heuristique) :

[1] Emmanuel M. Bomze et Marcello Pelillo [2000]. «Approximation de la clique de poids maximum à l'aide de la dynamique du réplicateur. Transactions IEEE sur les réseaux de neurones 11 (6)

[2] Marcello Pelillo et Andrea Torsello [2006]. "Payoff-Monotonic Game Dynamics and the Maximum Clique Problem." Calcul neuronal 18: 1215-1258.

Σ2PΣ2P

[3] Kousha Etessami et Andreas Lochbihler [2008] "La complexité de calcul des stratégies évolutives stables". International Journal of Game Theory , 37 (1): 93-113. (Disponible pour la première fois en 2004 sous le rapport technique ECCC TR04-055).

[4] Vincent Conitzer [2013] "La complexité de calcul exacte des stratégies évolutionnaires stables". La 9e conférence sur l'économie du Web et de l'Internet (WINE) . ( pdf ).

De nombreuses questions EGT intéressantes concernent aujourd'hui les jeux sur les graphiques, et bien qu'il y ait des résultats sympas sur le système dynamique, comme (voir également cette question pour les extensions de cette approche):

[5] Hisashi Ohtsuki et Martin Nowak [2006] "L'équation du réplicateur sur les graphiques." _ Journal of Theoretical Biology_, 243 (1), 86-97 ( lien , article de blog )

La plupart des travaux passent par la modélisation basée sur les agents (voir cette réponse pour un contexte de modélisation de la propagation des maladies). Ces modèles sont généralement beaucoup plus accueillants pour les déclarations de complexité et de convergence. Regardez le livre suivant pour en savoir plus:

[6] Yoav Shoham et Kevin Leyton-Brown [2009], "Multiagent systems: algorithmic, game-theory, and logic foundation", Cambridge University press.

Je pense que l'apprentissage automatique est une façon assez simple d'approcher l'EGT, car c'est un point naturel à mi-chemin entre la physique pertinente (mécanique statistique) et l'informatique. Cela a certainement été fait, il me faudrait un peu pour trouver une bonne référence, mais une référence aléatoire (qui montre également que les gens EGT ont considéré d'autres concepts d'équilibre populaires, comme l'équilibre corrélé):

[7] Sergiu Hart et Andreu Mas-Colell [2000], "Une procédure adaptative simple conduisant à un équilibre corrélé", Econometrica 68 (5): 1127-1150

[8] Antonella Ianni [2001], "Apprentissage des équilibres corrélés dans les jeux de population", Mathematical Social Sciences 42 (3): 271-294.

[9] Ludek Cigler et Boi Faltings [2011], «Atteindre les équilibres corrélés grâce à l'apprentissage multi-agents», AAMAS 2011: 509-516

J'espère vraiment que d'autres donneront des réponses plus spécifiques, car c'est une question sur laquelle j'ai toujours voulu en savoir plus.

Artem Kaznatcheev
la source
5

Comme d'autres l'ont dit, il y a moins que ce à quoi vous vous attendez. Quelques articles tangentiellement liés:

"Les poids multiplicatifs dans les jeux de coordination et la théorie de l'évolution" de Chastain, Livnat, Papadimitriou et Vazirani. Cet article soutient que la dynamique évolutive (dans un modèle simple) équivaut à un jeu de coordination entre les gènes joués avec l'algorithme d'apprentissage des poids multiplicatifs. Ils analysent la variante 2 gènes, dans un modèle simplifié.

Notez que l'algorithme des poids multiplicatifs est une dynamique naturelle connue pour converger vers l'équilibre de Nash dans les jeux à somme nulle, les jeux à potentiel non atomique et quelques autres (voir par exemple Freund et Schapire )

"Le prix de l'anarchie stochastique" de Chung, Ligett, Pruhs et moi-même (depuis un certain temps). Nous étudions ici les états stochastiquement stables d'un jeu, qui sont liés à l'ESS. Nous ne nous inquiétons pas de la complexité de les trouver, mais nous montrons que dans certains jeux, le prix de l'anarchie est inférieur à l'ensemble des équilibres stochastiquement stables par rapport aux équilibres arbitraires de Nash.

Aaron Roth
la source