Expliquer les stratégies mixtes pour les jeux à un coup

13

Dans l'introduction classique à la théorie des jeux non coopératifs, la stratégie mixte pour un joueur est enseignée comme une distribution sur l'espace de stratégie pour le joueur. La distribution nous donne essentiellement les probabilités (disons, un ensemble de stratégies discrètes) avec lesquelles un joueur devrait jouer les stratégies dans un équilibre de Nash.

Cependant, les probabilités portent la notion d'être des fréquences et elles signifient essentiellement la fraction à long terme des jeux dans lesquels le joueur devrait jouer la stratégie. Cependant, le réglage est un jeu à un coup et c'est une contradiction.

Comment résoudre la contradiction en expliquant ce qu'est une stratégie mixte?

Bravo
la source
2
Ce n'est pas une contradiction pour celui qui prend l' interprétation de la propension à la probabilité, qui considère le comportement à long terme comme la manifestation de probabilités de cas unique.
Pburg

Réponses:

11

Ariel Rubinstein a tendance à être perspicace concernant ce genre de questions.

Il aborde l'interprétation des stratégies mixtes dans la section 3 de cet article.

Quelques interprétations possibles en dehors de la randomisation délibérée:

  1. Purification: Une stratégie mixte est un plan d'action basé sur des informations non spécifiées dans le modèle.
  2. Une histoire à long terme fictive.
  3. Moyennes de la population, alors imaginez que le joueur est tiré d'une distribution de population où différents types jouent différentes stratégies pures. La distribution de la population est la distribution de stratégie mixte.

Une citation intéressante concernant la stratégie mixte du joueur reflétant l'incertitude parmi concernant ce que vais faire:iii

La stratégie mixte peut également être considérée comme la croyance de tous les autres joueurs concernant les actions d'un joueur. Un équilibre de stratégie mixte est alors un n-tuple d'attentes de connaissances communes, qui a la propriété que toutes les actions auxquelles une probabilité strictement positive est attribuée sont optimales, compte tenu des croyances. Le comportement d'un joueur peut être perçu par tous les autres joueurs comme le résultat d'un dispositif aléatoire même si ce n'est pas le cas. L'adoption de cette interprétation nécessite la réévaluation d'une grande partie de la théorie des jeux appliquée. En particulier, cela implique qu'un équilibre ne conduit pas à une prédiction (statistique ou autre) du comportement des joueurs. L'action de tout joueur i qui est la meilleure réponse compte tenu de ses attentes envers les autres joueurs le comportement (les autres n-1 stratégies) est cohérent en tant que prédiction de l'action de i (cela peut inclure des actions qui ne sont pas prises en charge par la stratégie mixte). Cela rend vide toute analyse comparative ou analyse comparative du bien-être de l'équilibre de la stratégie mixte et remet en question l'énorme littérature économique qui utilise l'équilibre de la stratégie mixte.

Pburg
la source
6

Soit une stratégie qui attache des probabilités à jouer , et soit l'ensemble des stratégies qui aboutissent à un équilibre dans un jeu symétrique à deux joueurs.si={pAi,pBi}A,Bs={si,si}i

Comme vous le dites, nous pensons que est une probabilité avec laquelle une action spécifique est jouée. Chaque fois que n'est pas un singleton, nous avons des équilibres multiples, ce que la plupart des branches de l'économie n'aiment pas, car cela rend la résolution de modèles assez difficile, et la non-unicité est difficile à travailler: comment devrions-nous simuler le modèle? Lequel des équilibres se joue réellement?sis

Au moins, avec des équilibres à stratégie mixte, nous connaissons la probabilité que chacun des équilibres se produise. Vous n'aimez pas les probabilités dans la mesure où elles véhiculent des fréquences, qui, selon vous, sont contredites par la notion de jeu à un coup.

Simultanément Cependant, le jeu en un coup ne signifie pas que le jeu n'est joué qu'une seule fois. Dans un monde avec de nombreux individus, tout le monde peut trouver un partenaire et jouer l'une des stratégies de , dans la mesure où nous (en même temps!) En trouvons à l'équilibre , et le fraction d'individus jouant le prochain équilibre, etc.spA{A,A}pB

De manière non simulée En guise d'alternative, vous pourriez faire valoir que dans un monde où règne beaucoup d'anonymat, les gens oublient les partenaires avec lesquels ils ont joué auparavant. Nous avons beaucoup de gens qui jouent des stratégies dans au temps , puis nous les découplons, donnons à chacun de nouveaux partenaires et les laissons jouer à nouveau. Même s'il y a la possibilité de rencontrer à nouveau le même gars: puisque cette possibilité va à zéro, vous pouvez modéliser cela comme un jeu répété avec un facteur de réduction .stδ0

Manque d'engagement Enfin, pensez aux situations qui sont en fait des jeux répétés, comme les interactions entre le gouvernement et les consommateurs. Bien que cela puisse être modélisé comme un jeu répété, nous pourrions penser que le gouvernement n'est pas en mesure de s'engager dans une séquence stratégique. Par conséquent, au lieu de modéliser cela comme un jeu répété, nous le modélisons comme des répétitions de l'équilibre à un coup: étant donné un horizon temporel , nous verrons que de l'époque, le gouvernement et les consommateurs jouent l'équilibre , etc.TTpA{A,A}

FooBar
la source
2

Ceci est un supplément de la citation de Pburg:

Un point de vue dans Aumann et Brandenburger (1995) est que la stratégie mixte est uniquement aux yeux des adversaires. Dans un jeu à joueurs, l'ensemble des états du monde . Pour un état , il satisfait la spécification suivante:NS:=×iNSisS

  1. Pour un joueur , soit la projection sur le ème composant d'un état. Lorsqu'un état est réalisé, le joueur est absolument sûr de son propre type , mais incertain de l'état exact. En d'autres termes, elle ne sait pas quel état dans est obtenu. Au lieu de cela, elle avait une croyance sur , qui est spécifiée par .iπi:SSiiisiπi1(si)πi1(si)si
  2. Soit espace d'action du joueur . Son action est une variable aléatoire , tandis que sa restriction est constante.Aiiai:SAiai|πi1(si)
  3. La fonction d'utilité joueur est définie de la même manière que , ce qui signifie fait référence à la même fonction d'utilité, pour tous les pour tous les .g i a i g ( s ) : AR s π - 1 i ( s i ) s iigiaig(s):ARsπi1(si)si
Metta World Peace
la source
1

Eh bien, voici ma chance de répondre, à la suite de cet article dans la physique http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf. Je pense que cette propension est une belle interprétation de stratégies mixtes, mais plus formellement, nous devrions dire qu'elle capture l'ignorance du modélisateur. Nous disons que tout se passe, en fait toutes les stratégies pourraient être prises (si le soutien est partout positif) mais le concept de solution dit que certaines sont plus probables. Les probabilités mesurent ici l'ignorance du modélisateur et sont le résultat du manque d'informations du théoricien du jeu sur le jeu. Pour clarifier cela, pensez à un ensemble de données amélioré où nous connaissons des informations supplémentaires sur le jeu, disons que nous parlons avec l'un des joueurs et qu'il nous assure qu'il va adopter une stratégie, peu importe quoi, alors nous pouvons faire une prédiction plus précise dans le forme d'une pure stratégie. Des fréquences surviennent lorsque nous considérons le jeu comme un jeu typique,

user157623
la source
0

Cela ne s'applique pas à tous les jeux, mais il existe également des situations dans lesquelles (au moins certains d'entre eux) les joueurs utilisent réellement des dispositifs de randomisation dans les jeux qui pourraient être considérés comme un coup. Ici, les distributions de probabilité ne sont pas des fréquences, ce sont les distributions que le dispositif de randomisation utilise. Tout équilibre de stratégie mixte est alors un équilibre au sens ex ante (bien que les joueurs puissent très bien puiser dans le dispositif de randomisation une seule fois, et il peut ne pas y avoir de sens dans lequel la situation ex post est un équilibre).

Les exemples comprennent:

Martin Van der Linden
la source