L'idée est précisément que les joueurs ne choisissent pas l'action s , mais seulement une action à la fois à chaque nœud où ils jouent, en fonction de leurs croyances sur la façon dont les autres joueurs et eux-mêmes joueront aux futurs nœuds du jeu (où les croyances sont conditionnelles à l'historique qui a conduit à ce nœud).
L'interprétation selon laquelle laisser les joueurs choisir des stratégies complètes est équivalente à laisser les joueurs s'appuyer sur un programme informatique pour jouer le jeu à leur place. Autrement dit, ils peuvent s'engager via ce programme informatique à jouer une action donnée sur chaque nœud.
De tels jeux avec des dispositifs d'engagement sont par essence très différents des jeux dans lesquels les joueurs réels doivent choisir à plusieurs reprises une action à chacun de leurs nœuds de décision. Lorsque de vrais joueurs jouent aux nœuds, les joueurs doivent former des croyances sur la façon dont les autres joueurs et eux-mêmes joueront sur les futurs nœuds, et ces croyances peuvent dépendre de l'histoire qui a conduit aux futurs nœuds .
Par exemple, dans un jeu de Stackelberg, le leader pourrait croire que le suiveur sera rationnel (ie, maximisation de l'utilité) si le leader joue "Faible production", mais irrationnel (ie, non maximisation de l'utilité) si le leader joue "Elevé" production". Peut-être que le leader anticipe que le suiveur sera en colère si le leader joue "High production", et que, aveuglé par sa colère, le suiveur voudra alors riposter.
Si le suiveur avait pu s'engager à travers une stratégie, le jeu aurait été complètement différent. Peut-être que l'adepte aurait pu s'engager à ne pas riposter avant de se mettre en colère, et elle ne pouvait plus aider son désir de riposter. Mais ici, l'idée est que le véritable adepte doit choisir une action plus tard dans le jeu compte tenu de ce que le leader a choisi au nœud racine. Par conséquent, la règle de comportement par laquelle le suiveur choisit une action sur un nœud (par exemple, utilité max vs non utilité max), et les croyances du leader sur ces procédures peuvent dépendre de l'historique qui a conduit à ce nœud également.
Cela ouvre la voie à de nombreux nouveaux résultats du jeu qui n'auraient pas émergé de la théorie des jeux classiques. D'un point de vue conceptuel, il fait également passer l'accent des concepts de solution à l'hypothèse épistémique et comportementale (c'est-à-dire de la théorie des jeux classique à la théorie des jeux épistémiques). Au lieu d'identifier un ensemble de résultats raisonnables (par exemple, les résultats d'équilibre de Nash) et d'examiner les stratégies qui correspondent à ces résultats, on identifie les propriétés raisonnables des comportements et des croyances des joueurs (sur les croyances et les comportements des uns et des autres), et tire les conclusions de ces hypothèses épistémiques et comportementales pour le résultat à mesure que le jeu se déroule .
Maintenant, c'est juste pour donner de la chair et de l'intuition au cadre de Battigalli, et cela ne rend pas justice à la richesse du cadre (en partie parce que je ne sais pas grand-chose de son travail autre que la vidéo que vous avez liée). Si vous ne l'avez pas encore fait, je vous recommande fortement de regarder l'intégralité de la vidéo. Je pense que Battigalli fait un excellent travail pour rendre son framework accessible. Il présente également des exemples utiles et intuitifs pour relier son approche épistémique à la théorie des jeux "classique" en identifiant des conditions simples sur les croyances et les comportements des joueurs qui permettent de récupérer des solutions classiques à des jeux tels que l'induction en arrière.