Il y a une question populaire, appelée "Meilleure question de statistiques jamais".
Si vous choisissez une réponse à cette question au hasard, quelle est la chance que vous ayez raison?
A) 25% B) 50% C) 60% D) 25%
Cette tâche n'est pas très difficile, la bonne réponse est 0%. Mais si nous le modifions comme ceci:
Si vous choisissez une réponse à cette question au hasard, quelle est la chance que vous ayez raison?
A) 50% B) 25% C) 60% D) 50%
Quelle sera la bonne réponse? Avons-nous deux bonnes réponses: 25% et 50%, ou il n'y a pas de bonne réponse, car avec ces deux bonnes réponses, la chance de choisir la bonne réponse est en fait 75% (mais nous n'avons pas 75% écrit sur le bureau )?
Au fait. La réponse 0% reste-t-elle la bonne réponse, la troisième bonne réponse dans ce cas?
la source
Réponses:
Les paradoxes apparents (de logique ou de probabilité) peuvent être résolus en formulant les questions clairement et soigneusement.
L'analyse suivante est motivée par l'idée de défendre une réponse: lorsqu'un candidat à l'examen peut présenter un état de fait possible (cohérent avec toutes les informations disponibles) dans lequel sa réponse est effectivement correcte, alors il doit être marqué comme correct. De manière équivalente, une réponse est incorrecte en l’absence d’une telle défense; elle est considérée comme correcte sinon. Ceci modélise les interactions habituelles entre les correcteurs (bienveillants, rationnels) et les candidats (rationnels) :-). Le paradoxe apparent est résolu en présentant plusieurs de ces moyens de défense pour la deuxième question, dont un seul pourrait s'appliquer dans tous les cas.
Je prendrai le sens de "aléatoire" dans ces questions dans un sens conventionnel: pour modéliser un choix de réponse aléatoire, j'écrirai chaque réponse sur une feuille de papier ("ticket") et je la mettrai dans une boîte: ce sera quatre billets au total. Sortir un ticket de la boîte (après avoir soigneusement et aveuglément mélangé le contenu de la boîte) est un modèle physique pour un choix "aléatoire". Il motive et justifie un modèle de probabilité correspondant .
Maintenant, que signifie "avoir raison"? Dans mon ignorance, j'explorerai toutes les possibilités. Dans tous les cas, je considère comme certain que zéro, un ou même plusieurs billets peuvent être "corrects". (Comment pourrais-je savoir? Je consulte simplement la feuille de notation!) Je marquerai les réponses "correctes" comme telles en écrivant la valeur sur chaque ticket correct et en écrivant sur les autres. C'est une routine et cela ne devrait pas être controversé.1 0
Une chose évidente mais importante à noter est que la règle pour écrire ou doit être basée uniquement sur la réponse écrite sur chaque ticket: mathématiquement, c'est un mappage (ou une réaffectation) envoyant l'ensemble des réponses listées ( dans les deux questions) dans l'ensemble . Cette règle est nécessaire pour l'auto-cohérence.0 1 {.25,.50,.60} {0,1}
Passons maintenant à l'élément probabiliste de la question: par définition, la chance d'être correct, sous un tirage aléatoire de tickets, est l' attente des valeurs avec lesquelles ils ont été marqués. L'espérance est calculée en additionnant les valeurs sur les tickets et en les divisant par leur nombre total. Ce sera donc , , , ou .0 .25 .50 .75 1
Un marquage aura du sens à condition que seuls les tickets dont les réponses correspondent à l'attente soient marqués de s1 . Il s'agit également d'une exigence d'auto-cohérence. Je prétends que c'est le nœud du problème: trouver et interpréter les marquages qui ont du sens. S'il n'y en a pas, la question elle-même peut être qualifiée de vide de sens. S'il y a un marquage unique, alors il n'y aura pas de controverse. Ce n'est que si deux ou plusieurs marquages ont un sens qu'il y aura une difficulté potentielle.
Quels marquages ont du sens?
Nous n'avons même pas besoin de faire une recherche exhaustive. Dans la première question , les attentes inscrites sur les billets sont de 25%, 50% et 60%. Ce dernier est impossible avec quatre billets. Le premier nécessiterait de marquer exactement un ticket; le second, deux billets. Cela donne au maximum marquages possibles à explorer. Le seul marquage qui fait sens met s sur chaque ticket. Pour ce marquage, l'attente est . Cela justifie la réponse affirmée à la première question. (Sans doute, la seule réponse correcte à la première question est de ne sélectionner aucune réponse!)3+3=6 0 (0+0+0+0)/4=0
Dans la deuxième question , les mêmes réponses apparaissent et encore une fois il y a six repères à explorer. Cette fois, trois marquages sont cohérents. Je les tabule:
Par conséquent, il y a trois définitions distinctes possibles de "correct" dans le deuxième problème, conduisant à ce que A ou D soit correct (dans la solution 1) ou seulement B soit correct (dans la solution 2), ou aucune des réponses ne soit correcte (dans solution 3).
Une façon d'interpréter cet état de fait est que pour chacune des réponses A, B et D, il existe au moins une façon de marquer les tickets qui rend ces réponses correctes. Cela ne signifie pas que les trois sont simultanément corrects: ils ne peuvent pas l'être, car . Si vous étiez le correcteur du test, alors si vous aviez corrigé A, B ou D, vous n’obtiendrez pas d’argument du candidat; mais si vous en avez marqué un incorrect,.25≠.50 le candidat aurait une base légitime pour contester votre score: il invoquerait la solution 1 ou la solution 2. En effet, si un candidat refusait de répondre à la question, la solution 3 lui donnerait une base légitime pour faire valoir que son non -la réponse devrait également obtenir un crédit complet!
En résumé, cette analyse aborde la deuxième partie de la question en concluant que l' une des réponses suivantes à la question 2 doit être indiquée comme correcte car chacune d'elles est défendable : A, B, D, A et D, et rien. Aucune autre réponse ne peut être défendue et ne serait donc pas correcte.
la source
Je pense qu'il y a ici un problème de sémantique en plus de la probabilité. Choisir au hasard est clair. Chacun de A, B, C et D sera sélectionné à 25%. Mais que signifie être correct lorsque vous choisissez au hasard? Il semble que cela devrait signifier étant donné que vous choisissez A comme réponse, donnez le% correct d'échantillons qui sera correct et le même pour B, C et D. Donc, vous devez compter 1/4 pour chaque réponse correcte et additionner toutes les bonnes réponses pour obtenir le bon pourcentage. Mais cela conduit à un argument circulaire. D'où le paradoxe. Cela semble vraiment être une question de logique plutôt que de probabilité ou de statistique.
la source
whuber donne une excellente analyse où plusieurs réponses sont autorisées. Cependant, il existe également un moyen cohérent de comprendre la question de sorte qu'il n'y a qu'une seule bonne réponse (bien que nous devions l'indiquer dans le cadre de la question):
Encore une fois, nous définirons une réponse "correcte" comme étant une réponse rationnellement défendable et suivrons l'argument de whuber. Un marquage est une carte de l'ensemble des réponses à telle que les réponses correctes sont envoyées à 1 et les réponses incorrectes à 0. Il existe trois marquages auto-cohérents possibles:{0,1}
Pourtant, nous avons besoin d'une autre étape logique pour les réduire à une seule réponse défendable. En posant ce problème, l'enseignant était confronté à trois marques possibles, chacune pouvant être une réponse unique aussi acceptable que les autres. Cependant, comme une seule réponse peut être correcte, l'enseignant doit choisir au hasard entre elles. Cela attribue une probabilité égale à chaque marquage de sorte que:
Cela se traduit par l'attente que l'élève aura raison % du temps. Ainsi, 25% devrait être la bonne réponse et le marquage de la solution 2 devrait être choisi. Il s'agit d'une mise à jour cohérente de la priorité de l'enseignant sur les trois marquages possibles, c'est-à-dire que si la solution 2 est fixée pour être le bon marquage 100% du temps, alors 25% est toujours la seule réponse correcte.(50+25+0)/3=25
Résumé: Si nous précisons qu'il n'y a qu'une seule bonne réponse, alors cette réponse est de 25%.
la source
Je pense que la réponse est 1/3. Nous ne savons pas quelle réponse (25%, 50% ou 60%) est correcte. Ainsi, chaque réponse, 25%, 50% et 60% a 1/3 de chance d'être correcte si elle est sélectionnée. Même si 25% apparaît deux fois, il a encore 1/3 de chance d'être la bonne réponse. Peu importe le nombre de fois où 25% apparaît comme réponse. Si elle apparaît 10 fois avec les 50% et les 60%, la probabilité que ce soit la bonne réponse serait toujours de 1/3. Cela suppose qu'une des réponses est correcte. S'il est possible qu'aucune des réponses ne soit correcte, la réponse serait 1/4. Ceci est basé sur mon interprétation de ce que la question demande.
la source