Quand un récepteur doit-il randomiser les actions dans un jeu de signalisation?

10

Supposons qu'il y ait un jeu de signalisation avec un espace de message fini M , espace action finie A , et un espace de type fini T . Encore plus simple, tous les types d'expéditeurs ont des préférences identiques (le récepteur préfère simplement différentes actions en réponse à différents types). Le récepteur peut-il faire mieux que jamais en randomisant les réponses? Lorsqu'un équilibre existe où le récepteur ne prend que des actions pures?

L'ubiquité résume bien ma question: "Est-il toujours vrai que l'équilibre avec les gains les plus élevés du récepteur implique nécessairement des stratégies mixtes?"

Allons-y avec l'équilibre séquentiel. Si vous souhaitez commencer par une notation.

σt(m) est la probabilité quetT envoiemM .

σRm(a) est la probabilité que le récepteur répond àm avecaA. μmΔT donne les croyances du récepteur après avoir observém .

Un équilibre séquentiel nécessite que σt donne des réponses optimales étant donné σR , σR est optimal étant donné μ et μ est bayésien étant donné σ . C'est vraiment la définition d'un séquentiel faible, mais il n'y a pas de distinction dans un jeu de signalisation.

Mon intuition dit non lorsqu'il existe un équilibre où le récepteur ne joue que des actions pures, mais j'ai toujours été horrible avec ce genre de choses. Peut-être que nous devons également stipuler que ce n'est pas un jeu à somme nulle, mais je dis seulement cela parce que je me souviens que les joueurs étaient mieux lotis avec la possibilité de randomiser dans ces jeux. Peut-être que c'est une note de bas de page dans un document quelque part?

Considérez le jeu ci-dessous où les préférences de l'expéditeur ne sont pas identiques. Je m'excuse pour la mauvaise qualité. Il existe trois types d'expéditeurs, chacun étant également probable. Nous ne pouvons créer ce que je crois être l'équilibre optimal du récepteur (joueur 2) que s'ils randomisent à la réception du message 1. Ensuite, les types 1 et 3 joueront , créant un équilibre de séparation. Si le récepteur utilise une stratégie pure en réponse à m 1 , un type 1 ou 2 dévierait et aggraverait le récepteur.m2m1

σRm1(a)=.5=σRm1(r)=.5

entrez la description de l'image ici

Pburg
la source
Les actions prises par le destinataire en fonction du type ont-elles un impact sur le message envoyé par l'expéditeur ou sont-elles indépendantes?
Martin Van der Linden
Je ne sais pas exactement ce que tu veux dire. Il existe un type de récepteur. Leur stratégie mappe les messages dans une distribution sur les actions. Ils n'ont un impact sur le message que dans la mesure où les expéditeurs jouent la meilleure réponse.
Pburg
2
Supposons qu'il existe un équilibre dans lequel le récepteur randomise sur un ensemble d'actions . Cela signifie, par définition, qu'il doit être indifférent entre deux distributions de probabilité sur α - y compris celles dans lesquelles tout le poids est mis sur une seule action (stratégies pures). Donc non, une stratégie mixte ne peut jamais être strictement meilleure que la meilleure stratégie pure. Ou ai-je mal compris la question? αα
Ubiquitaire
@Ubiquitous Cela a du sens pour moi, mais je me demandais s'il pouvait y avoir des cas pathologiques étranges. Par exemple, je n'ai pu trouver qu'un théorème, "Pour des choix génériques de gains dans un jeu de forme finie étendue avec un rappel parfait, les gains sont constants sur chaque composante connectée des équilibres séquentiels." La mise en garde générique m'a fait me demander.
Pburg
1
@Pburg Oui, je vois. Il semble que nous pensions à différentes questions. Je pensais "est-il toujours le cas que la meilleure réponse unique du récepteur à une stratégie d'expéditeur donnée soit une stratégie mixte?", Alors qu'il semble que votre question soit en fait "est-il toujours vrai que l'équilibre avec les gains les plus élevés du récepteur implique nécessairement stratégies mixtes? "
Ubiquitaire

Réponses:

3

J'ai peut-être un contre-exemple!

m1,m2,m3t1,t2,t3Pr(t=t3)=12ϵPr(t=t2)=14Pr(t=t1)=14+ϵm30

L'ensemble des réponses du récepteur à un message estm=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

uR(t1,m1,a)=uR(t2,m2,a)=2 , ,uR(t3,mi,a)=1

uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1 .

Puis en équilibre, tous les expéditeurs doivent obtenir le même utilitaire, correct?. Sinon, l'un imitera la stratégie de l'autre.

Ainsi, le seul équilibre de stratégie pure est que tous les expéditeurs choisissent . Dans un équilibre de mise en commun sur ou , la meilleure réponse est de choisir . Il n'y a pas de stratégie pure séparant l'équilibre sauf si et envoient , et le récepteur répond avec . Alors est indifférent entre tous les messages, car il recevra sûrement le gain . Tout cela donne au récepteur un gainm3m1m2rt1t2m2rt3032ϵ

Considérons alors le cas où etMaintenant, les expéditeurs sont indifférents entre l'envoi de ces deux messages. Soit ensuite et pour . La stratégie du récepteur est alors rationnelle.σRm1(a)=βσRm2(a)=1.σti(mi)=1i=1,2σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1)σti(mi)=1i=1,2

L'utilité attendue du récepteur à partir de étant donné ou est 1,5. L'utilité attendue de est légèrement supérieure à 1,5, étant donné . Le gain escompté ex ante est donc supérieur à , meilleur que l'équilibre pur décrit ci-dessus. De plus, cette séparation n'est maintenue que par mélange. Toute autre stratégie pure prise par le récepteur induira la mise en commun des expéditeurs, ce qui signifie que le seul équilibre de stratégie pure est lorsque le récepteur choisit . a r m 2 a 3m1arm2ar32ϵr

Je devrais avoir dans l'image ci-dessous pour les gains de l'expéditeur gauche à . Je pense que le est l'ingrédient clé.a β < 1βaβ<1

entrez la description de l'image ici

Pburg
la source
3

Je pense que cela ne peut pas se produire avec des expéditeurs opposés au risque, un récepteur neutre au risque et assez riche.A

Par exemple, et pour s'en tenir au modèle de signalisation canonique, supposons que est la ligne réelle positive et que l'utilité des expéditeurs augmente dans temps tandis que celle du récepteur a une utilité linéaire décroissante dans .u a aAuaa

(Certes, ce n'est qu'une réponse partielle car le cadre est beaucoup moins général que celui de votre question, donc il pourrait ne pas vous satisfaire. Je fournis toujours un argument au cas où vous seriez d'accord avec ces hypothèses)

Pour obtenir une contradiction, supposons que , à un équilibre et pour certains . Laisserσ m R ( a ) > 0σRm(a)>0σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

Par aversion au risque

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

Sous une certaine hypothèse de continuité, il doit également exister

a<a

tel que

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

Considérez donc construit de la manière suivanteσRm

  • σRm(a)=σRm(a)=0 ,
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • Pour tous les autres ,a~σRm(a~)=σRm(a~)

Les récepteurs préféreraient à s'il ne modifiait pas les signaux envoyés par les expéditeurs, car cela implique des compensations attendues plus faibles. Mais par construction, les expéditeurs sont indifférents entre et , ils doivent donc envoyer les mêmes signaux que dans . Ainsi, ne peut pas être un équilibre qui montre que nous ne pouvons pas avoir deux actions différentes jouées avec une probabilité positive à l'équilibre. Σ m R σ m RσRmσRm Σ m R σ m R σ m RσRmσRmσRmσRm

Martin Van der Linden
la source
Dans ce modèle, le récepteur ne choisirait-il pas toujours simplement ? a=0
Pburg
Je ne pense pas que ce soit nécessairement le cas. Si le récepteur choisit toujours soit le signal, il n'incite pas les types "élevés" à révéler leur type à travers un signal "supérieur". Cela peut être optimal dans un équilibre de mise en commun, mais pas dans un équilibre de séparation. Voir par exemple la section 13.C de Mas-Colell, Whinston et Green, bien que la configuration soit encore un peu différente de la vôtre (par exemple, il y a deux entreprises en compétition pour les travailleurs de types différents)a
Martin Van der Linden
Que signifie alors "l'utilité linéaire du récepteur dans un" moyen?
Pburg
Désolé, ce n'était pas très clair. Dans le modèle de signalisation Spence que j'ai en tête, l'action du récepteur consiste à payer un salaire w à l'expéditeur. L'utilité du récepteur dépend du type de l'expéditeur t, moins le salaire payé t − w. Fondamentalement, le récepteur est neutre en termes de risque: elle ne se soucie que du salaire attendu qu'elle devra payer et du type attendu qu'elle emploiera.
Martin Van der Linden
D'accord, je suppose que j'ai vu cela comme une perte quadratique,Merci pour la suggestion, bien que je cherche quelque chose d'un peu plus général mais avec des actions discrètes. (tw)2.
Pburg