Ce ne sont pas des devoirs. Je suis intéressé à comprendre si ma logique est correcte avec ce simple problème de statistiques.
Disons que j'ai une pièce à 2 faces où la probabilité de retourner une tête est et la probabilité de retourner une queue est . Supposons que tous les flips aient des probabilités indépendantes. Maintenant, disons que je veux maximiser mes chances de prédire si la pièce sera une tête ou une queue au prochain tour. Si , je peux deviner des têtes ou des queues au hasard et la probabilité que je me trompe est de .1 - P ( H ) P ( H ) = 0,5 0,5
Maintenant, supposons que , si je veux maximiser mes chances de deviner correctement, devrais-je toujours deviner les queues où la probabilité est de ?0,8
Pour aller plus loin, si j'avais un dé à 3 faces et que la probabilité de lancer un 1, 2 ou 3 était , et , devrais-je toujours deviner 2 pour maximiser mes chances de deviner correctement? Existe-t-il une autre approche qui me permettrait de deviner plus précisément?P ( 2 ) = 0,5 P ( 3 ) = 0,4
la source
Réponses:
Tu as raison. Si , et que vous utilisez une perte nulle (c'est-à-dire, vous devez deviner un résultat réel par opposition à une probabilité ou quelque chose, et en outre, obtenir des têtes lorsque vous avez deviné la queue est aussi mauvais que obtenir des queues lorsque vous avez deviné des têtes), vous devez deviner les queues à chaque fois.P(H)=0.2
Les gens pensent souvent à tort que la réponse est de deviner les queues sur 80% des essais sélectionnés au hasard et les têtes sur le reste. Cette stratégie est appelée « appariement des probabilités » et a été largement étudiée dans la prise de décisions comportementales. Voir, par exemple,
West, RF et Stanovich, KE (2003). L'appariement des probabilités est-il intelligent? Associations entre choix probabilistes et capacités cognitives. Memory & Cognition, 31 , 243–251. doi: 10.3758 / BF03194383
la source
Vous posez essentiellement une question très intéressante: devrais-je prédire en utilisant l' estimation "MAP Bayesian" Maximum a posteriori ou "Real Bayesian".
Supposons que vous connaissiez la vraie distribution que , puis en utilisant l'estimation MAP, supposons que vous vouliez faire 100 prédictions sur les 100 prochains résultats de retournement. Vous devriez toujours deviner que le flip est la queue , PAS deviner têtes et queues. Cela s'appelle "MAP Bayesian", en gros vous faites20 80P(H)=0.2 20 80
Il n'est pas difficile de prouver qu'en procédant ainsi, vous pouvez minimiser l'erreur prédite (perte 0-1). La preuve se trouve à ~ page 53 de Introduction to Statistical Learning .
Il existe une autre façon de procéder, appelée approche "Real Bayesian". Fondamentalement, vous n'essayez pas de "sélectionner le résultat avec la probabilité la plus élevée, mais considérez tous les cas de manière probabiliste". Donc, si quelqu'un vous demande de "prédire les 100 prochains flips", vous devez le mettre en pause, car lorsque vous avez donné 100 résultats binaires, les informations probabilistes pour chaque résultat disparaissent. Au lieu de cela, vous devriez demander ce que vous voulez faire APRÈS avoir connu les résultats.
Supposons qu'il ait une fonction de perte (non nécessaire pour une perte de 0-1, par exemple, la fonction de perte peut être, si vous manquez une tête, vous devez payer 1 $ , mais si vous manquez une queue, vous devez payer 5 $ , c.-à-d. Perte déséquilibrée) sur votre prédiction, alors vous devriez utiliser vos connaissances sur la distribution des résultats pour minimiser la perte sur toute la distribution
, c.-à-d., incorporez vos connaissances sur la distribution à perte, au lieu de "la manière mise en scène", obtenez les prédictions et faites les prochaines étapes.
De plus, vous avez une très bonne intuition sur ce qui se passera quand il y aura de nombreux résultats possibles. L'estimation MAP ne fonctionnera pas bien si le nombre de résultats est important et la masse de probabilité est largement répartie. Pensez que vous avez 100 dés et vous connaissez la vraie distribution. Où et . Maintenant, que faites-vous avec MAP? Vous devinerez toujours que vous obtenez le premier côté , car il a la plus grande probabilité de se comparer aux autres. Cependant, vous vous tromperez des fois !!P(S1)=0.1 P(S2)=P(S3)=P(S100)=0.9/99=0.009090 S1 90%
la source
En raison de l'indépendance, votre valeur d'attente est toujours maximisée si vous devinez le cas le plus probable. Il n'y a pas de meilleure stratégie car chaque flip / roll ne vous donne aucune information supplémentaire sur la pièce / dé.
Partout où vous devinez un résultat moins probable, votre attente de gagner est moindre que si vous aviez deviné le cas le plus probable, il vaut donc mieux deviner le cas le plus probable.
Si vous vouliez faire en sorte que vous deviez changer de stratégie au fur et à mesure que vous retourniez, vous pourriez envisager une pièce / dé dont vous ne connaissez pas les chances au départ et vous devez les comprendre au fur et à mesure que vous lancez.
la source