J'ai lu le paradoxe des paris de Blackwell sur le placard Futility . Voici le résumé: vous êtes présenté avec deux enveloppes, et . Les enveloppes contiennent une somme d'argent aléatoire, mais vous ne savez rien de la distribution de l'argent. Vous en ouvrez un, vérifiez combien il y a d'argent ( ) et devez choisir: prenez l'enveloppe ou ?E y x E x E y
Futility Closet fait référence à un mathématicien du nom de Leonard Wapner: «De manière inattendue, il y a quelque chose que vous pouvez faire, à moins d'ouvrir l'autre enveloppe, pour vous donner une chance meilleure que égale de bien faire les choses.»
L'idée, qui me semble erronée, est la suivante: choisir un nombre aléatoire . Si , prenez . Si , choisissez .d < x E x d > x E y
Wapner: «Si d se situe entre x et y, alors votre prédiction (comme indiqué par d) est garantie d'être correcte. Supposons que cela se produit avec la probabilité p. Si d tombe moins que x et y, votre prédiction ne sera correcte que si le nombre x choisi est le plus grand des deux. Il y a 50% de chances que cela se produise. De même, si d est supérieur aux deux nombres, votre prédiction ne sera correcte que si le nombre choisi est le plus petit des deux. Cela se produit également avec une probabilité de 50%. »
Si la probabilité que soit dans est supérieure à zéro, le succès moyen de cette méthode est . Cela signifierait qu'en observant une variable aléatoire non apparentée nous donne des informations supplémentaires.[ x , y ] 1
Je pense que tout cela ne va pas et que le problème réside dans le choix d'un nombre aléatoire en nombres entiers. Qu'est-ce que ça veut dire? Comme, n'importe quel entier? Dans ce cas, la probabilité que se situe entre et est nulle, car et sont finis.d x y x y
Si nous disons qu'il y a une limite sur le montant maximal d'argent, disons , ou au moins nous choisissons d parmi , alors la recette se résume au conseil trivial de choisir si et choisir si .1 ... M E y x < M / 2 E x x > M / 2
Dois-je manquer quelque chose ici?
ÉDITER
OK, maintenant je commence à voir d'où vient le paradoxe apparent. Il me semblait impossible qu'une variable aléatoire non apparentée puisse fournir des informations supplémentaires.
Cependant, notons que nous devons consciemment choisir une distribution de d . Par exemple, choisissez les limites pour une distribution uniforme, ou de la distribution Poissionian etc. Clairement, si nous jouons pour les arachides, et nous avons choisi la distribution de d pour être uniforme sur dollars, . Cette dernière probabilité dépendra avant tout de notre jugement sur ce qui peut être dans les enveloppes.[ 10 9 , 2 ⋅ 10 9 ] P ( d ∈ ( x , y ) ) = 0
En d'autres termes, si la technique fonctionne, l'hypothèse selon laquelle nous ne savons pas quelle est la répartition de l'argent dans les enveloppes (comment le montant d'argent pour les enveloppes a été choisi) est violée. Cependant, si nous ne savons vraiment pas ce qu'il y a dans les enveloppes, alors dans le pire des cas, nous ne perdons rien en l'appliquant.
EDIT 2
Une autre pensée. Étant donné , choisissons, pour le dessin , une distribution non négative continue telle que . Nous sommes autorisés à le faire, ai-je raison? Nous procédons comme indiqué - si , nous gardons l'enveloppe, si , nous changeons l'enveloppe. Le raisonnement ne change pas, selon la façon dont nous choisissons la distribution, il peut s'agir de (ou je me trompe?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d ∈ [ x , y ] ) > 0
Cependant, étant donné la façon dont nous avons choisi la distribution, ce que nous faisons maintenant équivaut à un tirage au sort. On jette une pièce, et si c'est des têtes, on change des enveloppes, si c'est des queues, on s'en tient à l'enveloppe qu'on tient. Où ai-je tort?
EDIT 3 :
OK, je comprends maintenant. Si nous basons la fonction de probabilité de sur (par exemple, nous échantillonnons partir d'une distribution uniforme dans la plage , alors la probabilité n'est pas indépendante de .x d ( 1 , 2 ⋅ x ) P ( d ∈ ( x , y ) ) P ( décision correcte | d ∉ ( x , y ) )
Donc, si (avec probabilité ), la supposition est toujours correcte, comme précédemment. Cependant, si est le nombre inférieur et , a plus de chances d'être inférieur à que d'être supérieur à , nous sommes donc biaisés vers une décision incorrecte. Le même raisonnement s'applique lorsque est le plus élevé des deux nombres.p x d ∉ ( x , y ) d x x x
Cela signifie que nous devons choisir le processus de dessin de indépendamment de . En d'autres termes, nous devons deviner les paramètres de distribution à partir desquels et sont tirés; le pire qui se passe est que nous devinons encore au hasard, mais le mieux ce qui se passe est que notre supposition était correcte - et alors nous avons un avantage. Comment cela devrait être mieux que de deviner "x et y seront, je pense, au moins 1 $ , mais au plus 10 $ , donc si , nous le gardons, et sinon, nous l’échangeons" Je dois encore voir.x x y x > 5
J'ai été induit en erreur par la formulation pop-sci du problème dans le livre de Wapner ( Attentes inattendues: les curiosités d'une boule de cristal mathématique ), qui déclare
"Par quelque moyen que ce soit, sélectionnez un entier positif aléatoire" (Wapner suggère une distribution géométrique - lancer des pièces jusqu'à ce que les premières têtes se lèvent, répétant le processus si ) "Si d > x devine plus haut et si d < x suppose plus bas. (...) Vous devinerez correctement plus de 50% du temps parce que d pointe correctement plus de 50% du temps! "
la source
Réponses:
Il s'agit plus largement du problème des deux enveloppes . Le plus souvent, les montants sont donnés en et 2 A, mais il n'est pas obligatoire que ce soit le cas.A 2A
Quelques points:
Vous ne pouvez pas choisir un entier aléatoire uniformément *, mais la partie citée ne semble pas exiger qu'il soit uniforme. Choisissez une distribution - peu importe ce qu'elle est pour l'argument - tant qu'elle a une certaine probabilité de dépasser toute valeur finie.
Il ne serait pas logique de choisir entier avec la règle de décision citée, car l'argent est discret, ce qui signifie qu'il y a une chance non nulle d = x et qu'il n'y a rien de répertorié pour ce cas. (Ou bien, pour modifier la règle pour spécifier quoi faire quand ils sont égaux)d d=x
En laissant cela de côté, vous pouvez choisir dans une distribution continue non négative - nous n'avons donc pas à nous soucier de l'égalité.d
* (vous ne pouvez pas non plus choisir un entier non négatif uniformément aléatoire ni un entier positif uniformément aléatoire)
Cependant, les versions de ce jeu qui m'ont été présentées pour la première fois sont que l'enveloppe est présentée par quelqu'un qui cherche (éventuellement) à minimiser vos revenus du jeu. La stratégie consistant à utiliser une distribution pour décider de passer à l'autre enveloppe fonctionnera toujours dans ce cas.
la source
L'argument de Wapner est correct!
Certains commentaires:
Un problème lié mais différent:
Comme plusieurs @Glen_b et @whuber l'ont mentionné, il y a un puzzle connexe connu sous le nom de problème des deux enveloppes où un argument fallacieux est donné pour toujours changer d'enveloppe et le défaut de l'argument peut être vu en adoptant une approche bayésienne et en ajoutant des croyances antérieures sur le contenu des deux enveloppes.
Dans un certain sens cependant, le puzzle décrit ici est assez différent. L'argument de Wapner est correct!
la source
J'ai été intrigué par cela et j'ai adopté l'approche pragmatique de jouer avec lui dans Excel.
J'ai généré trois nombres aléatoires pour x, y et d dans la gamme 1-100. J'ai ensuite fait la comparaison entre d et x et entre x et y et j'ai regardé le résultat, bon ou mauvais.
Je l'ai fait 500 fois et je l'ai répété plusieurs fois et j'ai régulièrement obtenu la bonne réponse sur 330 sur 500, comme prévu.
J'ai ensuite augmenté la plage de d à 1-10000 et la réponse correcte est tombée à environ 260 pour 500 exécutions.
Alors oui, la sélection de d dépend des valeurs attendues de x et y.
Bob
la source
Je pense que le paradoxe apparent avec l'expansion de Wapner de l'équation p + (1-p) / 2 est qu'il suppose que (1-p) / 2> 0. Pour de nombreuses plages de d, cette valeur est 0.
Par exemple: tout d sélectionné à partir d'une distribution symétrique centrée sur la valeur dans l'enveloppe ouverte, donne une probabilité de mal 1/2 et correct 1/2.
Toute distribution asymétriquement choisie semble biaiser le choix dans le mauvais sens la moitié du temps.
Existe-t-il donc un moyen de choisir une plage et une distribution pour d telles que cette équation soit vraie?
la source