Osborne, les équilibres de Nash et l'exactitude des croyances

12

Dans Anborne to Game Theory Nash, l'équilibre d' Osborne est décrit comme suit (p. 21-22):

Tout d'abord, chaque joueur choisit son action selon le modèle de choix rationnel, compte tenu de ses convictions sur les actions des autres joueurs. Deuxièmement, la croyance de chaque joueur sur les actions des autres joueurs est correcte.

Il me semble que cette définition n'est pas complètement équivalente à la définition habituelle de l'équilibre de Nash en tant que profil de stratégie où la stratégie de chaque joueur est la meilleure réponse aux stratégies des autres.

La définition habituelle ne dit rien sur les croyances et permet donc la possibilité que les croyances soient incorrectes.

Pour prendre une possibilité triviale, considérons le dilemme du prisonnier. Supposons que chaque joueur pense que l'autre joueur ne se confessera pas. Étant donné que la confession est une stratégie dominante, chaque joueur avouerait toujours. Les actions constituent donc un équilibre de Nash même si les croyances des joueurs sont complètement à l'opposé des actions d'équilibre réelles.

Ai-je raison de comprendre que la définition d'Osborne caractérise autre chose que l'équilibre de Nash?

Jyotirmoy Bhattacharya
la source
Ne fonctionne pas « La définition habituelle ne dit rien sur les croyances et permet donc la possibilité que les croyances pourraient être incorrectes. » Tout simplement parce que vous avez toujours une hypothèse de rationalité sous-jacente dans ces définitions?
Thorst

Réponses:

9

Introduire le langage des croyances ici est un peu étrange, étant donné que les croyances ont une signification très spécifique dans d'autres parties de la théorie des jeux.

aii1ai

i{aj}jiai1i


i

  • Si le jeu est souvent joué (en mettant de côté les problèmes d'autres résultats qui peuvent être maintenus dans les jeux répétés), nous pouvons penser que Nash est un équilibre dans le sens où si nous y convergeons, nous pouvons développer une norme par laquelle les gens continuent jouer cet équilibre indéfiniment (et s'attendre à ce que les autres fassent de même).
  • Si le jeu est vraiment à un coup, nous invoquons généralement l'idée que les joueurs vont essayer de prédire ce que les autres feront - et notre notion d'équilibre intègre l'idée que ces prédictions doivent être correctes.

Il semble que les prédictions du deuxième point correspondent aux «croyances» invoquées par Osborne. Cependant, il est important de souligner que ces prédictions / "croyances" ne sont qu'un outil informel / intuitif pour nous aider à conceptualiser ce qui se passe dans un équilibre et ne font pas partie de la définition d'un tel équilibre. Le concept d'équilibre de Nash lui-même est complètement agnostique sur la notion de croyances (comme vous le remarquez dans un commentaire, il n'est défini que par des actions), c'est pourquoi, quand Osborne continue à définir formellement l' équilibre de Nash, il le fait sans invoquer le idée des croyances du tout.

Ubiquitaire
la source
4

L'introduction de la croyance rend le concept de NE comparable à d'autres concepts de raffinement tels que PBE et l'équilibre séquentiel, mais la signification de NE n'est pas modifiée.

Le micro manuel de troisième cycle de Mas-Colell, Whinston et Green (MWG) a un résultat pour cela

σΓEμ

  1. σμ HPr(H|σ)>0
  2. Le système de croyances est dérivé du profil de stratégie travers la règle de Bayes chaque fois que possible.μσ

Ainsi, l'exemple du dilemme du prisonnier que vous donnez lorsque les joueurs ont des croyances opposées à ce que la stratégie réelle de l'adversaire échoue à la deuxième condition, qui exige que les croyances soient dérivées de la règle de Bayes dans la mesure du possible. En fait, c'est l'équivalent mathématique de la deuxième exigence de la définition d'Osborne: que la croyance d'un joueur sur les actions des autres joueurs est correcte.

Herr K.
la source
Je pense qu'il y a une différence entre MWG et Osborne. MWG dit que pour un équilibre de Nash "il existe" un système de croyances qui le rend sensible. Nous ne savons pas quelles croyances, le cas échéant, les joueurs ont réellement. Osborne dit que les joueurs ont des convictions et qu'ils sont les bons. Je pensais que ce dernier modifiait la signification conceptuelle de NE car la définition habituelle ne mentionne pas du tout les croyances et l'exemple du dilemme du prisonnier montre que les stratégies ne déterminent pas uniquement les croyances.
Jyotirmoy Bhattacharya
@JyotirmoyBhattacharya: Je ne pense pas que MWG soit "silencieux sur les croyances éventuelles des joueurs". La condition 2 de la proposition exige en fait que cette croyance soit dérivée du profil de stratégie d'équilibre en utilisant la règle de Bayes dans la mesure du possible. Ainsi, dans l'exemple PD, lorsqu'un joueur choisit un défaut avec la probabilité 1, la croyance de l'autre joueur doit également mettre la probabilité 1 sur le défaut d'action et répondre au mieux compte tenu d'une telle croyance (ce qui l'amène également à choisir le défaut).
Herr K.
@JyotirmoyBhattacharya: Cependant, la croyance en NE ne doit pas être unique. En effet, si pour un équilibre donné, un chemin sur un arbre de jeu est pris avec une probabilité nulle, alors la règle de Bayes ne s'applique pas, et donc toute croyance sur ce chemin serait considérée comme "correcte" dans un NE. C'est aussi pourquoi des améliorations telles que l'équilibre séquentiel sont introduites, afin d'exclure les croyances déraisonnables des chemins d'équilibre.
Herr K.
@JyotirmoyBhattacharya: De plus, comme il s'agit d'un manuel de premier cycle, Osborne a peut-être choisi une langue plus intuitive que mathématiquement rigoureuse pour des raisons pédagogiques. Pour moi, les deux conditions dans la définition d'Osborne sont des contreparties exactes dans la proposition de MWG.
Herr K.
3

L'exemple de dilemme de votre prisonnier ne fonctionne que parce que c'est un jeu avec des stratégies dominantes. Osborne a raison.

Pour mieux répondre à la stratégie d'un autre joueur, comme dans la définition que vous donnez, je dois connaître sa stratégie. En d'autres termes, je dois avoir des croyances sur ce qu'ils font, et ces croyances doivent être correctes. Il s'agit d'un renforcement du concept de rationalisation.

Vous faites un point intéressant sur la façon dont vous pouvez obtenir d'étranges «équilibres» dans les jeux avec des stratégies dominantes. Cela équivaut à un résultat équivalent et où pourrait être erroné et un poids positif à des stratégies non rationalisables. Mais, je n'ai jamais vu d'équilibre de Nash qui comprenait des croyances. Les définitions dont je me souviens sont: "un profil de stratégie est un équilibre de Nash si(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)... "Je crois que cela signifie que la définition des croyances n'est pas nécessaire, car les croyances sont exactement une évaluation correcte du profil de stratégie. Le référencement, un de mes livres, donne la définition habituelle avec une citation de Nash (1950), et Ensuite, nous discutons de deux hypothèses sous-jacentes: l'une est la croyance correcte et l'autre le jeu rationnel étant donné ces croyances correctes.

Pburg
la source
Mais pour réfuter quelque chose, un seul exemple suffit. Si vous considérez Osborne comme affirmant que sa définition est équivalente à celle de Nash, alors comment traiter le contre-exemple du dilemme du prisonnier. Je comprends que la définition d'Osborne est un renforcement de la rationalisation, je soumets que ce n'est pas l'équilibre de Nash pour la simple raison qu'ici l'équilibre est défini sur les actions et les croyances alors que l'équilibre de Nash est complètement silencieux sur les croyances.
Jyotirmoy Bhattacharya
1
C'est une définition, pas une preuve.
Pburg
C'est suffisant. Mais c'est une définition d'un concept qui a déjà une autre définition bien acceptée. Je suppose donc que si l'auteur ne mentionne pas le contraire, il prétend que les deux définitions sont équivalentes.
Jyotirmoy Bhattacharya
pour être clair, inclut-il ces commentaires dans la définition ou dans la discussion? ps j'ai édité ma réponse
Pburg
La partie que j'ai citée est une discussion. Immédiatement après cela, il dit (p. 22) "Ces deux composantes sont incorporées dans la définition suivante" et donne ensuite la définition standard en termes de meilleure réponse aux stratégies qui ne mentionne pas du tout les croyances. Alors, où sont les croyances incarnées dans la définition? Et le problème n'est pas seulement dans les jeux avec des stratégies dominantes. Il est tout à fait possible de construire des exemples où il n'y a pas de stratégies dominantes mais les stratégies d'équilibre de Nash sont les meilleures réponses à des croyances différentes du jeu d'équilibre.
Jyotirmoy Bhattacharya
2

Je répète peut-être des choses qui ont été dites auparavant, mais voici mon point de vue à ce sujet.

Je pense que nous sommes confrontés à un problème habituel lors de la comparaison de deux modèles différents. Ce que signifie une «équivalence» n'est pas complètement évident parce que les deux définitions se trouvent dans des mondes différents ou des modèles différents. Cependant, si "l'équivalence" est correctement définie, je pense que l'on peut donner un sens à la définition d'Osborne et montrer qu'elle est en effet "équivalente" à un NE.

Le concept de solution sous-jacent à la section citée ressemblerait à ceci:

Équilibre de croyance (BE):> Un profil de stratégie et un profil de croyance dans lequel pour tout acteursbi

ui(si | si=bi)ui(s | si=bi) for all sSi
et
bi=si

Maintenant, le problème si nous voulons arriver à une déclaration "d'équivalence" est que d'une part, nous avons l'EB qui "vit" dans un monde avec ... des croyances, et de l'autre la notion NE qui vit dans un monde ... exempt de croyances. Que signifierait donc une déclaration d'équivalence comme "NE BE"?

1) BE NE

Cette direction de l'implication n'est probablement pas controversée, car nous passons d'un modèle plus complexe à un modèle plus simple. "Chaque BE est un NE" devrait signifier que si nous regardons le profil de stratégie d' équilibre d'un BE seul (c'est-à-dire sans son profil de croyance ), il devrait être un NE. On peut vérifier que c'est le cas.p

2) NE BE

Ceci est la partie délicate. Qu'est-ce que cela signifie que "chaque NE est un BE"? Certainement pas que "un NE plus n'importe quel profil de croyance est un BE", comme l'OP l'a montré avec son contre-exemple. Pourtant, il est vrai que «tout élément NE peut devenir un BE pour un profil de croyance ». Je pense que c'est dans ce sens qu'il faut comprendre la revendication d '"équivalence" d'Osborne

Notez que nous avons également la déclaration suivante, qui ressemble davantage à une "équivalence": "Un résultat du jeu est un résultat NE si et seulement s'il s'agit d'un résultat BE".

Martin Van der Linden
la source
Mais chaque BE n'est pas un NE car le concept BE est un affaiblissement de la rationalisation qui nous est strictement plus faible que le NE.
Jyotirmoy Bhattacharya
Comme je l'ai écrit, j'ai du mal à comprendre ce que cela signifie pour un BE "de ne pas être" un NE car ils semblent vivre dans des modèles différents. Voulez-vous dire que certaines stratégies jouées à un BE ne sont pas NE? Je pensais que c'était incorrect, mais j'aurais peut-être manqué quelque chose. Si c'est ce que vous voulez dire, pourriez-vous me diriger vers un contre-exemple? Ce serait très utile.
Martin Van der Linden
Je ne suis pas sûr que BE soit un affaiblissement de la rationalisation. À ma connaissance, BE est la rationalisation avec la condition que les conjectures sont correctes, non? Si c'est exact, ne serions-nous pas plus forts que la rationalisation? (cela pourrait bien sûr dépendre de ce que l'on appelle un concept de solution "plus faible / plus fort")
Martin Van der Linden