Enveloppe Paradox

8

Il y a deux enveloppes. L'un contient argent et l'autre contient montant d'argent. Le montant exact " " m'est inconnu, mais je sais ce qui précède. Je prends une enveloppe et je l'ouvre. Je vois argent, évidemment , où .x2xxyy{x,2x}

Maintenant, on me propose de conserver ou de changer d'enveloppe.

La valeur attendue de la commutation est . La valeur attendue de conserver mon enveloppe est .(122y+1212y)=54yy

Il semble que je devrais toujours changer d'enveloppe. Mes deux questions:

Ce raisonnement est-il correct?

Est - ce différent si je ne suis pas autorisé à ouvrir l'enveloppe et voir la somme d'argent, et je me donne la possibilité de changer indéfiniment?y

Cavalerie Kitsune
la source
1
Vous ne pouvez pas simplement répondre à cette attente, vous devez commencer avec des croyances sur x et mettre à jour vos croyances selon la règle de Bayes. Une fois que vous voyez y, vos croyances concernant l'enveloppe que vous avez ouverte auront changé.
HRSE
Disons que x est uniformément distribué entre 0 et . Alors quoi?
Cavalerie Kitsune
@KitsuneCavalry Il n'y a pas une telle distribution. (Veuillez m'envoyer un programme générant une telle distribution.) En fait, il n'y a pas de résolution qui génère les croyances antérieures données dans votre question pour toutes les valeurs dey. Dans le lien de Herr K., cela est expliqué dans en.wikipedia.org/wiki/…
Giskard
3
@Kitsune Cavalry La distribution uniforme sur la demi-ligne (ou sur toute la ligne) est une priorité bien connue dans les statistiques bayésiennes, voir pour un avant-goût stats.stackexchange.com/a/97790/28746 ou stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos

Réponses:

5

Voici une approche «maximisation de l'utilité attendue / théorie des jeux» (avec un tiret de probabilité théorique). Dans un tel cadre, les réponses apparaissent claires.

LOCAUX

On nous dit en toute honnêteté que, par x un montant monétaire strictement positif, les deux billets suivants ont été placés dans une boîte: {A=x,B=2x} avec numéro d'identification attribué 1 et {A=2x,B=x} avec numéro d'identification attribué 0. Puis un tirage au sort d'un Bernoulli (p=0.5) variable aléatoire a été exécutée, et en fonction du résultat et de l'événement qui s'est produit, les montants x et 2x ont été placés dans des enveloppes A et B. On ne nous dit pas quelle est la valeur dex est, ou quel montant est allé à quelle enveloppe.

Premier CAS: Choisissez une enveloppe avec la possibilité de changer sans l'ouvrir

Le premier problème est de savoir comment choisir une enveloppe ? Cela a à voir avec les préférences. Supposons donc que nous sommes des maximiseurs d'utilité attendus, avec une fonction d'utilitéu().

Nous pouvons modéliser ici la structure probabiliste en considérant deux variables aléatoires dichotomiques, A et Breprésentant les enveloppes et leur montant. Le soutien de chacun est{x,2x}. Mais ils ne sont pas indépendants. Nous devons donc commencer par la distribution conjointe. Sous forme de tableau, la distribution conjointe et les distributions marginales correspondantes sont

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Cela nous dit que A et B ont des distributions marginales identiques.

Mais cela signifie que la façon dont nous choisissons les enveloppes n'a pas d'importance, car nous obtiendrons toujours la même utilité attendue ,

0.5u(x)+0.5u(2x)

Ce à quoi nous sommes confrontés ici, c'est un pari composé (comment choisir une enveloppe) sur deux paris identiques (chaque enveloppe). Nous pouvons choisirA avec probabilité 1, 0, ou quelque chose entre les deux (et en complément pour B). Ça n'a pas d'importance. Nous obtiendrons toujours le même utilitaire attendu. Notez que notre attitude envers le risque ne joue aucun rôle ici.

Nous choisissons donc une enveloppe, disons Aet nous l'examinons. Quelle est maintenant notre utilité attendue? Exactement les mêmes qu'avant de choisir . Choisir une enveloppe de quelque manière que ce soit n'affecte pas les probabilités de ce qu'il y a à l'intérieur.

Nous sommes autorisés à changer. Disons que oui, et maintenant nous tenons l'enveloppeB. Quelle est maintenant l'utilité attendue? Exactement comme avant .

Ce sont les deux états possibles du monde pour nous: choisir A ou choisissez B. Quel que soit le choix, les deux états du monde impliquent la même valeur pour notre force motrice choisie / supposée (c.-à-d. Maximiser l'utilité attendue).

Donc ici, nous sommes indifférents au changement. , et en fait, nous pourrions également randomiser.

2ème CAS: OUVRIR L'ENVELOPPE avec la possibilité de basculer après

Supposons maintenant que nous avons choisi A, l'ouvrit et trouva l'intérieur du montant y{x,2x}. Est-ce que cela change les choses?

Voyons voir. Je me demande ce qui est

P(A=xA{x,2x})=?

Bien, {x,2x} est l'espace d'échantillon sur lequel la variable aléatoire Aest défini. Le conditionnement sur tout l'espace de l'échantillon, c'est-à-dire sur l'algèbre sigma triviale, n'affecte ni les probabilités, ni les valeurs attendues. C'est comme si on se demandait "quelle est la valeur deA si nous savons que toutes les valeurs possibles peuvent avoir été réalisées? "Aucune connaissance efficace n'a été acquise, nous sommes donc toujours à la structure probabiliste d'origine.

Mais je me demande aussi ce qui est

P(B=xA{x,2x})=?

L'énoncé de conditionnement, correctement considéré comme une algèbre sigma générée par l'événement {A{x,2x}}, est l'ensemble de l'espace d'échantillonnage du produit sur lequel le vecteur aléatoire (A,B)a été défini. D'après le tableau de la distribution conjointe ci-dessus, nous pouvons voir que l'allocation de probabilité du joint est équivalente à l'allocation de probabilité des marginaux (la qualification "presque sûrement" due à la présence de deux événements de mesure zéro). Ici aussi, nous conditionnons essentiellement les probabilités deBsur tout son espace d'échantillonnage. Il s'ensuit que notre action d'ouverture de l'enveloppe n'a pas affecté la structure probabiliste deB aussi.

Entrez dans la théorie des jeux, parallèlement à la prise de décision. Nous avons ouvert l'enveloppe et nous devons décider si nous allons changer ou non. Si nous ne changeons pas, nous obtenons une utilitéu(y). Si nous changeons, alors nous sommes dans les deux états possibles du monde suivants

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

Nous ne savons pas quel état détient réellement, mais d'après la discussion ci-dessus, nous savons que chacun a une probabilité p=0.5 d'exister.

Nous pouvons modéliser cela comme un jeu où notre adversaire est la "nature" et où nous savons que la nature joue avec certitude une stratégie aléatoire : avecp=0.5 y=x et avec p=0.5, y=2x. Mais nous avons aussi maintenant que si nous ne changeons pas, notre gain est certain. Voici donc notre jeu sous forme normale, avec nos gains:

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

Nous devons résister à la tentation de remplacer u(x) et u(2x) pour u(y). u(y)est un gain connu et certain. Les gains de la stratégie "Switch" ne sont pas réellement connus (car nous ne connaissons pas la valeur dex). Nous devons donc inverser la substitution . Siy=x puis u(2x)=u(2y), et si y=2x puis u(x)=u(y/2). Voici donc à nouveau notre jeu:

nous/la naturey=Xy=2XCommutateuru(2y)u(y/2)Ne changez pasu(y)u(y)

Maintenant, tous les gains de la matrice sont connus. Existe-t-il une stratégie purement dominante?

Le gain attendu de la stratégie "Switch" est

E(VS)=0,5u(2y)+0,5u(y/2)

Le gain attendu de la stratégie "Don't Switch" est

E(VS)=u(y)

Nous devrions changer si

E(VS)>E(VS)0,5u(2y)+0,5u(y/2)>u(y)

Et maintenant , l'attitude envers le risque devient critique. Il n'est pas difficile de déduire que sous une prise de risque et un comportement neutre au risque, nous devrions changer.

En ce qui concerne les comportements à risque , je trouve un résultat élégant:

Pour les fonctions utilitaires «moins concaves» (strictement ci-dessus) que les fonctions logarithmiques (par exemple, racine carrée), nous devons alors changer.

Pour l'utilitaire logarithmique u(y)=lny, nous sommes indifférents entre la commutation ou non.

Pour les fonctions utilitaires logarithmiques "plus concaves" que (strictement ci-dessous), nous ne devrions pas commuter.

Je termine avec le schéma du cas logarithmique

entrez la description de l'image ici

Présumer y=4. alorsy/2=2,2y=8. La ligneΓ-Δ-Εest la ligne sur laquelle se trouvera l'utilitaire attendu de "Switch". Puisque la nature joue un50-50 stratégie, il sera en fait au point Δ, qui est le point médian de Γ-Δ-Ε. À ce stade, avec l'utilitaire logarithmique, nous obtenons exactement le même utilitaire de "Don't Switch", c'est-à-direln(4) pour cet exemple numérique.

Alecos Papadopoulos
la source
Invoquer «l'aversion au risque» par le biais d'une fonction utilitaire logarithmique ne résout pas le paradoxe. Comme indiqué par @HRSE, en utilisant le théorème de Bayes, les probabilités que les gains soientu(2y) et u(y/2ne sont pas 0,5 après avoir vu le montant dans la première enveloppe. Cela ne serait valable que pour un uniforme très discutable impropre avant leX (pour X>0). Si vous utilisez un bon avantX (reflétant ses convictions sur X), la solution devient de changer si y est suffisamment petit et pour conserver la première enveloppe si yest suffisamment grand. Voir jstor.org/stable/2685310 .
Jarle Tufto
@JarleTufto D'après moi, le prieur uniforme est le bon prieur, si l'on décide de croire les organisateurs du jeu, quand ils disent que les sommes d'argent ont été mises dans les enveloppes suite à un tirage au sort de Bernoulli avec p=0,5. Si quelqu'un veut se méfier, ne pas croire les organisateurs et former une autre croyance préalable, c'est bien sûr son droit, mais il devra venir avec un argument pour me convaincre a) pourquoi les organisateurs mentent et b) comment choisit-il les différents avant qu'il choisit. Notez que ma réponse suppose que nous croyons les organisateurs en la matière.
Alecos Papadopoulos
J'accepte bien sûr que chaque enveloppe contenant des montants vous soit remise X et 2Xrespectivement avec des probabilités égales de 1/2. Ce que je dis, c'est que l'uniforme incorrect impliciteX que vous utilisez, c'est-à-dire π(X)=1, pour tous X>0 conduit au paradoxe parce que le théorème de Bayes conduit alors à P(X=y|Oui=y)=P(X=y/2|Oui=y)=1/2yest le montant observé dans la première enveloppe. Utiliser un bon préalableπ(X) au lieu de cela, ces probabilités conditionnelles diffèrent et la décision optimale dépend de y(et bien sûr la fonction utilitaire).
Jarle Tufto du
@JarleTufto Cette mauvaise mention préalable, elle reflète des probabilités liées à quoi?
Alecos Papadopoulos
Le montant d'argent dans les deux enveloppes est X et 2X. La distribution de probabilité antérieure représente vos croyances sur environXavant d'ouvrir une enveloppe. Vous utilisez soit implicitement cet a priori particulier, soit vous commettez l'erreur d'égaliser les probabilités conditionnelles inverses.
Jarle Tufto du
0

Si vous ouvrez l'enveloppe E1 et voyez que sa valeur est E1 = Y , alors il est vrai que la valeur de l'autre enveloppe E2 est dans {E2 = Y / 2, E2 = 2Y} .

Il est également vrai que la valeur attendue de cette enveloppe est (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

L'erreur est en supposant que Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 indépendamment de ce que Y est. Une façon simpliste de le montrer est de supposer que chaque enveloppe contient du papier-monnaie américain de diverses coupures. Si Y = 1 $ , il est impossible que E2 soit Y / 2 .

Une preuve plus rigoureuse est trop détaillée pour être fournie ici, mais un résumé consiste à supposer d'abord que, pour toute valeur Z , Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Il s'agit essentiellement de la même hypothèse que dans le dernier paragraphe, étendue à une plage de valeurs. Mais si cela est vrai pour n'importe quelle valeur de Z , cela signifie que Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) est constant pour chaque valeur de N , de -inf à inf. Étant donné que cela est impossible, l'hypothèse ne peut pas être correcte.

+++++

Cela a peut-être été un peu déroutant, alors laissez-moi essayer un exemple. On vous donne deux ensembles de deux enveloppes. Dans un ensemble, ils contiennent 10 et 20 dollars. Dans l'autre, ils contiennent 20 et 40. Vous choisissez un ensemble, puis ouvrez une enveloppe dans cet ensemble pour en trouver 20. Vous avez alors la possibilité de passer à l'autre enveloppe de cet ensemble. Devrais-tu?

Oui, devrait changer. Le gain attendu en passant à l'autre enveloppe est [(20-10) + (20-40)] / 2 = +5.

Notez que cette instance - c'est-à-dire, sachant que vous en avez trouvé 20, et non 10 ou 40, correspond aux conditions que vous décrivez dans votre question. Votre solution fonctionne donc. Mais l'expérience elle-même ne correspond pas à cette description. Si vous en aviez trouvé 10, ou si vous en aviez trouvé 40, la probabilité que l'autre enveloppe ait 20 est de 100%. Les gains attendus sont respectivement de +10 et -20. Et si vous faites la moyenne des trois gains possibles sur les probabilités, vous obtiendrez les trois valeurs, vous obtenez 10/4 + 5/2 - 20/4 = 0.

JeffJo
la source
Pourquoi devrais-je supposer qu'une enveloppe ne pourrait pas contenir 50 cents? De plus, la question porte spécifiquement sur les moments où vous ne connaissez pas les montants possibles qui pourraient y être, juste les montants relatifs possibles, donc je ne suis pas vraiment en train de suivre cela.
Kitsune Cavalry
J'ai dit que c'était une approche simpliste. Tout a commencé par «supposons que chaque enveloppe contienne du papier-monnaie américain». Comme vous ne pouvez pas avoir 50 cents de papier-monnaie américain, Pr (E2 =2|E1=1) = 1. Le fait est que, en supposant que Y / 2 et 2Y sont également probables, lorsque vous ne connaissez pas Y, vous supposez une distribution de facto pour Y qui est impossible à réaliser.
JeffJo
0

Généralement, le problème est insoluble car vous n'avez pas spécifié la procédure de randomisation de l'ensemble de l'expérience.

Mais que Y soit la valeur de l'enveloppe que vous avez choisie et X l'autre enveloppe. La réponse est alorsE[X|Oui=y]- qui est une attente conditionnelle . Cependant, en supposant une distribution la plus générale de Y, Y est uniformément tiré de tous lesR. Mais alorsPr(Oui=y)=0et par le paradoxe Borel – Kolmogorov, cette attente est insoluble.

John Rambo
la source
@JeffJo, je n'ai pas pu commenter sous votre message car je n'ai pas une réputation suffisante. J'ai ajouté cette réponse car je pense qu'elle est liée à votre message.
John Rambo