Supposons qu'il y ait un jeu de signalisation avec un espace de message fini , espace action finie , et un espace de type fini . Encore plus simple, tous les types d'expéditeurs ont des préférences identiques (le récepteur préfère simplement différentes actions en réponse à différents types). Le récepteur peut-il faire mieux que jamais en randomisant les réponses? Lorsqu'un équilibre existe où le récepteur ne prend que des actions pures?
L'ubiquité résume bien ma question: "Est-il toujours vrai que l'équilibre avec les gains les plus élevés du récepteur implique nécessairement des stratégies mixtes?"
Allons-y avec l'équilibre séquentiel. Si vous souhaitez commencer par une notation.
est la probabilité que envoie .
est la probabilité que le récepteur répond à avec donne les croyances du récepteur après avoir observé .
Un équilibre séquentiel nécessite que donne des réponses optimales étant donné , est optimal étant donné et est bayésien étant donné . C'est vraiment la définition d'un séquentiel faible, mais il n'y a pas de distinction dans un jeu de signalisation.
Mon intuition dit non lorsqu'il existe un équilibre où le récepteur ne joue que des actions pures, mais j'ai toujours été horrible avec ce genre de choses. Peut-être que nous devons également stipuler que ce n'est pas un jeu à somme nulle, mais je dis seulement cela parce que je me souviens que les joueurs étaient mieux lotis avec la possibilité de randomiser dans ces jeux. Peut-être que c'est une note de bas de page dans un document quelque part?
Considérez le jeu ci-dessous où les préférences de l'expéditeur ne sont pas identiques. Je m'excuse pour la mauvaise qualité. Il existe trois types d'expéditeurs, chacun étant également probable. Nous ne pouvons créer ce que je crois être l'équilibre optimal du récepteur (joueur 2) que s'ils randomisent à la réception du message 1. Ensuite, les types 1 et 3 joueront , créant un équilibre de séparation. Si le récepteur utilise une stratégie pure en réponse à m 1 , un type 1 ou 2 dévierait et aggraverait le récepteur.
la source
Réponses:
J'ai peut-être un contre-exemple!
L'ensemble des réponses du récepteur à un message estm=m1,m2 {a,r}
Puis en équilibre, tous les expéditeurs doivent obtenir le même utilitaire, correct?. Sinon, l'un imitera la stratégie de l'autre.
Ainsi, le seul équilibre de stratégie pure est que tous les expéditeurs choisissent . Dans un équilibre de mise en commun sur ou , la meilleure réponse est de choisir . Il n'y a pas de stratégie pure séparant l'équilibre sauf si et envoient , et le récepteur répond avec . Alors est indifférent entre tous les messages, car il recevra sûrement le gain . Tout cela donne au récepteur un gainm3 m1 m2 r t1 t2 m2 r t3 0 32−ϵ
Considérons alors le cas où etMaintenant, les expéditeurs sont indifférents entre l'envoi de ces deux messages. Soit ensuite et pour . La stratégie du récepteur est alors rationnelle.σm1R(a)=β σm2R(a)=1. σti(mi)=1i=1,2σt3(m1)=ϵ+1/4−ϵ+1/2=1−σt3(m1) σti(mi)=1 i=1,2
L'utilité attendue du récepteur à partir de étant donné ou est 1,5. L'utilité attendue de est légèrement supérieure à 1,5, étant donné . Le gain escompté ex ante est donc supérieur à , meilleur que l'équilibre pur décrit ci-dessus. De plus, cette séparation n'est maintenue que par mélange. Toute autre stratégie pure prise par le récepteur induira la mise en commun des expéditeurs, ce qui signifie que le seul équilibre de stratégie pure est lorsque le récepteur choisit . a r m 2 a 3m1 a r m2 a r32−ϵ r
Je devrais avoir dans l'image ci-dessous pour les gains de l'expéditeur gauche à . Je pense que le est l'ingrédient clé.a β < 1β a β<1
la source
Je pense que cela ne peut pas se produire avec des expéditeurs opposés au risque, un récepteur neutre au risque et assez riche.A
Par exemple, et pour s'en tenir au modèle de signalisation canonique, supposons que est la ligne réelle positive et que l'utilité des expéditeurs augmente dans temps tandis que celle du récepteur a une utilité linéaire décroissante dans .u a aA u a a
(Certes, ce n'est qu'une réponse partielle car le cadre est beaucoup moins général que celui de votre question, donc il pourrait ne pas vous satisfaire. Je fournis toujours un argument au cas où vous seriez d'accord avec ces hypothèses)
Pour obtenir une contradiction, supposons que , à un équilibre et pour certains . Laisserσ m R ( a ″ ) > 0σmR(a′)>0 σmR(a′′)>0 a′≠a′′∈A
Par aversion au risque
Sous une certaine hypothèse de continuité, il doit également exister
tel que
Considérez donc construit de la manière suivanteσmR′
Les récepteurs préféreraient à s'il ne modifiait pas les signaux envoyés par les expéditeurs, car cela implique des compensations attendues plus faibles. Mais par construction, les expéditeurs sont indifférents entre et , ils doivent donc envoyer les mêmes signaux que dans . Ainsi, ne peut pas être un équilibre qui montre que nous ne pouvons pas avoir deux actions différentes jouées avec une probabilité positive à l'équilibre. Σ m R σ m RσmR′ σmR Σ m R σ m R σ m RσmR′ σmR σmR σmR
la source