Il y a deux enveloppes. L'un contient argent et l'autre contient montant d'argent. Le montant exact " " m'est inconnu, mais je sais ce qui précède. Je prends une enveloppe et je l'ouvre. Je vois argent, évidemment , où .
Maintenant, on me propose de conserver ou de changer d'enveloppe.
La valeur attendue de la commutation est . La valeur attendue de conserver mon enveloppe est .
Il semble que je devrais toujours changer d'enveloppe. Mes deux questions:
Ce raisonnement est-il correct?
Est - ce différent si je ne suis pas autorisé à ouvrir l'enveloppe et voir la somme d'argent, et je me donne la possibilité de changer indéfiniment?
microeconomics
expected-utility
Cavalerie Kitsune
la source
la source
Réponses:
Voici une approche «maximisation de l'utilité attendue / théorie des jeux» (avec un tiret de probabilité théorique). Dans un tel cadre, les réponses apparaissent claires.
LOCAUX
On nous dit en toute honnêteté que, parX un montant monétaire strictement positif, les deux billets suivants ont été placés dans une boîte: {A=x,B=2x} avec numéro d'identification attribué 1 et {A=2x,B=x} avec numéro d'identification attribué 0 . Puis un tirage au sort d'un Bernoulli (p=0.5) variable aléatoire a été exécutée, et en fonction du résultat et de l'événement qui s'est produit, les montants x et 2x ont été placés dans des enveloppes A et B . On ne nous dit pas quelle est la valeur dex est, ou quel montant est allé à quelle enveloppe.
Premier CAS: Choisissez une enveloppe avec la possibilité de changer sans l'ouvrir
Le premier problème est de savoir comment choisir une enveloppe ? Cela a à voir avec les préférences. Supposons donc que nous sommes des maximiseurs d'utilité attendus, avec une fonction d'utilitéu() .
Nous pouvons modéliser ici la structure probabiliste en considérant deux variables aléatoires dichotomiques,A et B représentant les enveloppes et leur montant. Le soutien de chacun est{x,2x} . Mais ils ne sont pas indépendants. Nous devons donc commencer par la distribution conjointe. Sous forme de tableau, la distribution conjointe et les distributions marginales correspondantes sont
Cela nous dit queA et B ont des distributions marginales identiques.
Mais cela signifie que la façon dont nous choisissons les enveloppes n'a pas d'importance, car nous obtiendrons toujours la même utilité attendue ,
Ce à quoi nous sommes confrontés ici, c'est un pari composé (comment choisir une enveloppe) sur deux paris identiques (chaque enveloppe). Nous pouvons choisirA avec probabilité 1 , 0 , ou quelque chose entre les deux (et en complément pour B ). Ça n'a pas d'importance. Nous obtiendrons toujours le même utilitaire attendu. Notez que notre attitude envers le risque ne joue aucun rôle ici.
Nous choisissons donc une enveloppe, disonsA et nous l'examinons. Quelle est maintenant notre utilité attendue? Exactement les mêmes qu'avant de choisir . Choisir une enveloppe de quelque manière que ce soit n'affecte pas les probabilités de ce qu'il y a à l'intérieur.
Nous sommes autorisés à changer. Disons que oui, et maintenant nous tenons l'enveloppeB . Quelle est maintenant l'utilité attendue? Exactement comme avant .
Ce sont les deux états possibles du monde pour nous: choisirA ou choisissez B . Quel que soit le choix, les deux états du monde impliquent la même valeur pour notre force motrice choisie / supposée (c.-à-d. Maximiser l'utilité attendue).
Donc ici, nous sommes indifférents au changement. , et en fait, nous pourrions également randomiser.
2ème CAS: OUVRIR L'ENVELOPPE avec la possibilité de basculer après
Supposons maintenant que nous avons choisiA , l'ouvrit et trouva l'intérieur du montant y∈{x,2x} . Est-ce que cela change les choses?
Voyons voir. Je me demande ce qui est
Bien,{x,2x} est l'espace d'échantillon sur lequel la variable aléatoire A est défini. Le conditionnement sur tout l'espace de l'échantillon, c'est-à-dire sur l'algèbre sigma triviale, n'affecte ni les probabilités, ni les valeurs attendues. C'est comme si on se demandait "quelle est la valeur deA si nous savons que toutes les valeurs possibles peuvent avoir été réalisées? "Aucune connaissance efficace n'a été acquise, nous sommes donc toujours à la structure probabiliste d'origine.
Mais je me demande aussi ce qui est
L'énoncé de conditionnement, correctement considéré comme une algèbre sigma générée par l'événement{A∈{x,2x}} , est l'ensemble de l'espace d'échantillonnage du produit sur lequel le vecteur aléatoire (A,B) a été défini. D'après le tableau de la distribution conjointe ci-dessus, nous pouvons voir que l'allocation de probabilité du joint est équivalente à l'allocation de probabilité des marginaux (la qualification "presque sûrement" due à la présence de deux événements de mesure zéro). Ici aussi, nous conditionnons essentiellement les probabilités deB sur tout son espace d'échantillonnage. Il s'ensuit que notre action d'ouverture de l'enveloppe n'a pas affecté la structure probabiliste deB aussi.
Entrez dans la théorie des jeux, parallèlement à la prise de décision. Nous avons ouvert l'enveloppe et nous devons décider si nous allons changer ou non. Si nous ne changeons pas, nous obtenons une utilitéu(y) . Si nous changeons, alors nous sommes dans les deux états possibles du monde suivants
Nous ne savons pas quel état détient réellement, mais d'après la discussion ci-dessus, nous savons que chacun a une probabilitép=0.5 d'exister.
Nous pouvons modéliser cela comme un jeu où notre adversaire est la "nature" et où nous savons que la nature joue avec certitude une stratégie aléatoire : avecp=0.5 y=x et avec p=0.5 , y=2x . Mais nous avons aussi maintenant que si nous ne changeons pas, notre gain est certain. Voici donc notre jeu sous forme normale, avec nos gains:
Nous devons résister à la tentation de remplaceru(x) et u(2x) pour u(y) . u(y) est un gain connu et certain. Les gains de la stratégie "Switch" ne sont pas réellement connus (car nous ne connaissons pas la valeur dex ). Nous devons donc inverser la substitution . Siy=x puis u ( 2 x ) = u ( 2 y) , et si y= 2 x puis u ( x ) = u ( y/ 2) . Voici donc à nouveau notre jeu:
Maintenant, tous les gains de la matrice sont connus. Existe-t-il une stratégie purement dominante?
Le gain attendu de la stratégie "Switch" est
Le gain attendu de la stratégie "Don't Switch" est
Nous devrions changer si
Et maintenant , l'attitude envers le risque devient critique. Il n'est pas difficile de déduire que sous une prise de risque et un comportement neutre au risque, nous devrions changer.
En ce qui concerne les comportements à risque , je trouve un résultat élégant:
Pour les fonctions utilitaires «moins concaves» (strictement ci-dessus) que les fonctions logarithmiques (par exemple, racine carrée), nous devons alors changer.
Pour l'utilitaire logarithmiqueu ( y) = lny , nous sommes indifférents entre la commutation ou non.
Pour les fonctions utilitaires logarithmiques "plus concaves" que (strictement ci-dessous), nous ne devrions pas commuter.
Je termine avec le schéma du cas logarithmique
Présumery= 4 . alorsy/ 2=2,2y= 8 . La ligneΓ - Δ - E est la ligne sur laquelle se trouvera l'utilitaire attendu de "Switch". Puisque la nature joue un50 - 50 stratégie, il sera en fait au point Δ , qui est le point médian de Γ - Δ - E . À ce stade, avec l'utilitaire logarithmique, nous obtenons exactement le même utilitaire de "Don't Switch", c'est-à-direln( 4 ) pour cet exemple numérique.
la source
Si vous ouvrez l'enveloppe E1 et voyez que sa valeur est E1 = Y , alors il est vrai que la valeur de l'autre enveloppe E2 est dans {E2 = Y / 2, E2 = 2Y} .
Il est également vrai que la valeur attendue de cette enveloppe est (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .
L'erreur est en supposant que Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 indépendamment de ce que Y est. Une façon simpliste de le montrer est de supposer que chaque enveloppe contient du papier-monnaie américain de diverses coupures. Si Y = 1 $ , il est impossible que E2 soit Y / 2 .
Une preuve plus rigoureuse est trop détaillée pour être fournie ici, mais un résumé consiste à supposer d'abord que, pour toute valeur Z , Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Il s'agit essentiellement de la même hypothèse que dans le dernier paragraphe, étendue à une plage de valeurs. Mais si cela est vrai pour n'importe quelle valeur de Z , cela signifie que Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) est constant pour chaque valeur de N , de -inf à inf. Étant donné que cela est impossible, l'hypothèse ne peut pas être correcte.
+++++
Cela a peut-être été un peu déroutant, alors laissez-moi essayer un exemple. On vous donne deux ensembles de deux enveloppes. Dans un ensemble, ils contiennent 10 et 20 dollars. Dans l'autre, ils contiennent 20 et 40. Vous choisissez un ensemble, puis ouvrez une enveloppe dans cet ensemble pour en trouver 20. Vous avez alors la possibilité de passer à l'autre enveloppe de cet ensemble. Devrais-tu?
Oui, devrait changer. Le gain attendu en passant à l'autre enveloppe est [(20-10) + (20-40)] / 2 = +5.
Notez que cette instance - c'est-à-dire, sachant que vous en avez trouvé 20, et non 10 ou 40, correspond aux conditions que vous décrivez dans votre question. Votre solution fonctionne donc. Mais l'expérience elle-même ne correspond pas à cette description. Si vous en aviez trouvé 10, ou si vous en aviez trouvé 40, la probabilité que l'autre enveloppe ait 20 est de 100%. Les gains attendus sont respectivement de +10 et -20. Et si vous faites la moyenne des trois gains possibles sur les probabilités, vous obtiendrez les trois valeurs, vous obtenez 10/4 + 5/2 - 20/4 = 0.
la source
Généralement, le problème est insoluble car vous n'avez pas spécifié la procédure de randomisation de l'ensemble de l'expérience.
Mais que Y soit la valeur de l'enveloppe que vous avez choisie et X l'autre enveloppe. La réponse est alorsE[ X| Oui= y] - qui est une attente conditionnelle . Cependant, en supposant une distribution la plus générale de Y, Y est uniformément tiré de tous lesR . Mais alorsPr ( Y= y) = 0 et par le paradoxe Borel – Kolmogorov, cette attente est insoluble.
la source