Qu'est-ce que Battigalli veut vraiment dire par «les joueurs ne peuvent pas choisir de stratégies, ils ne peuvent que choisir des actions»?

9

Dans cette vidéo (de 7h30 à 9h00) sur Youtube, Battigalli mentionne l'état du monde pour un simple jeu de mille-pattes à trois pattes, qui, selon son propre mot, est

" Une description de tout ce qui compte, qui dans la théorie traditionnelle, doit inclure des stratégies qui caractérisent Ann et Bob. Je n'utilise pas le mot" Ann choisit une stratégie ". La raison est très simple. L'objet du choix est l'action, pas stratégie. Les joueurs ne peuvent pas choisir de stratégies, ils ne peuvent que choisir des actions. Si Ann peut choisir des stratégies ( C , C ) , ils jouent un jeu différent. "(C,C)

Que signifie vraiment Pierpaolo Battigalli? Si les actions choisies par un joueur ont été spécifiées, il spécifie automatiquement une stratégie pure. Par cette méthodologie, il semble vouloir distinguer une structure de jeu avec engagement et un jeu sans, mais comment?

Ajouté: Voici les diapositives utilisées dans la vidéo, et voici le papier correspondant.

Metta World Peace
la source

Réponses:

9

L'idée est précisément que les joueurs ne choisissent pas l'action s , mais seulement une action à la fois à chaque nœud où ils jouent, en fonction de leurs croyances sur la façon dont les autres joueurs et eux-mêmes joueront aux futurs nœuds du jeu (où les croyances sont conditionnelles à l'historique qui a conduit à ce nœud).

L'interprétation selon laquelle laisser les joueurs choisir des stratégies complètes est équivalente à laisser les joueurs s'appuyer sur un programme informatique pour jouer le jeu à leur place. Autrement dit, ils peuvent s'engager via ce programme informatique à jouer une action donnée sur chaque nœud.

De tels jeux avec des dispositifs d'engagement sont par essence très différents des jeux dans lesquels les joueurs réels doivent choisir à plusieurs reprises une action à chacun de leurs nœuds de décision. Lorsque de vrais joueurs jouent aux nœuds, les joueurs doivent former des croyances sur la façon dont les autres joueurs et eux-mêmes joueront sur les futurs nœuds, et ces croyances peuvent dépendre de l'histoire qui a conduit aux futurs nœuds .

Par exemple, dans un jeu de Stackelberg, le leader pourrait croire que le suiveur sera rationnel (ie, maximisation de l'utilité) si le leader joue "Faible production", mais irrationnel (ie, non maximisation de l'utilité) si le leader joue "Elevé" production". Peut-être que le leader anticipe que le suiveur sera en colère si le leader joue "High production", et que, aveuglé par sa colère, le suiveur voudra alors riposter.

Si le suiveur avait pu s'engager à travers une stratégie, le jeu aurait été complètement différent. Peut-être que l'adepte aurait pu s'engager à ne pas riposter avant de se mettre en colère, et elle ne pouvait plus aider son désir de riposter. Mais ici, l'idée est que le véritable adepte doit choisir une action plus tard dans le jeu compte tenu de ce que le leader a choisi au nœud racine. Par conséquent, la règle de comportement par laquelle le suiveur choisit une action sur un nœud (par exemple, utilité max vs non utilité max), et les croyances du leader sur ces procédures peuvent dépendre de l'historique qui a conduit à ce nœud également.

Cela ouvre la voie à de nombreux nouveaux résultats du jeu qui n'auraient pas émergé de la théorie des jeux classiques. D'un point de vue conceptuel, il fait également passer l'accent des concepts de solution à l'hypothèse épistémique et comportementale (c'est-à-dire de la théorie des jeux classique à la théorie des jeux épistémiques). Au lieu d'identifier un ensemble de résultats raisonnables (par exemple, les résultats d'équilibre de Nash) et d'examiner les stratégies qui correspondent à ces résultats, on identifie les propriétés raisonnables des comportements et des croyances des joueurs (sur les croyances et les comportements des uns et des autres), et tire les conclusions de ces hypothèses épistémiques et comportementales pour le résultat à mesure que le jeu se déroule .

Maintenant, c'est juste pour donner de la chair et de l'intuition au cadre de Battigalli, et cela ne rend pas justice à la richesse du cadre (en partie parce que je ne sais pas grand-chose de son travail autre que la vidéo que vous avez liée). Si vous ne l'avez pas encore fait, je vous recommande fortement de regarder l'intégralité de la vidéo. Je pense que Battigalli fait un excellent travail pour rendre son framework accessible. Il présente également des exemples utiles et intuitifs pour relier son approche épistémique à la théorie des jeux "classique" en identifiant des conditions simples sur les croyances et les comportements des joueurs qui permettent de récupérer des solutions classiques à des jeux tels que l'induction en arrière.

Martin Van der Linden
la source
Merci beaucoup pour votre réponse, qui est très utile. Il me semble que votre interprétation du principe de Battigalli, c'est-à-dire choisir des actions, pas des stratégies, équivaut à son système de croyances dynamiques, croyance conditionnée à des croyances conditionnelles plutôt qu'à une croyance en stratégies, et aussi, vous semblez faire référence à son résultat, sa croyance dynamique système et une forte croyance sur la rationalité impliquant une induction en arrière, ce qui est plus attrayant que la connaissance commune d'Aumann de la rationalité impliquant une induction en arrière.
Metta World Peace
Le problème est que ces choses sont développées par Battigalli et ses co-auteurs il y a plus d'une décennie. Mais cette conférence concerne son travail en 2013. Quelles sont les nouveautés?
Metta World Peace
"Si vous ne l'avez pas encore fait, je vous recommande fortement de regarder l'intégralité de la vidéo." L'expression "recommande fortement" est similaire à "croit fermement", comme l'a inventé Battigalli, n'est-ce pas? :)
Metta World Peace
@MettaWorldPeace: Je ne connaissais pas le travail de Battigalli avant de regarder la vidéo, donc je ne pouvais pas dire s'il y avait quelque chose de nouveau dedans ou s'il venait juste de présenter le travail qu'il avait développé au cours de la dernière décennie.
Martin Van der Linden