Ceci est apparu initialement dans le cadre de certains travaux que nous effectuons sur un modèle de classification de texte naturel, mais je l’ai simplifié ... Peut-être trop.
Vous avez une voiture bleue (par une mesure scientifique objective - elle est bleue).
Vous le montrez à 1000 personnes.
900 disent que c'est bleu. 100 pas.
Vous donnez cette information à quelqu'un qui ne peut pas voir la voiture. Tout ce qu'ils savent, c'est que 900 personnes ont dit qu'il était bleu et 100 non. Vous n'en savez pas plus sur ces personnes (les 1000).
Sur cette base, vous demandez à la personne: "Quelle est la probabilité que la voiture soit bleue?"
Cela a provoqué une énorme divergence d'opinions parmi ceux que j'ai demandés! Quelle est la bonne réponse s'il y en a une?
la source
Réponses:
TL; DR: À moins que vous ne supposiez que les gens jugent la couleur de la voiture de manière déraisonnable, ou que les voitures bleues sont trop rares, le nombre élevé de personnes dans votre exemple signifie que la probabilité que la voiture soit bleue est fondamentalement de 100%.
Matthew Drury a déjà donné la bonne réponse, mais j'aimerais juste ajouter quelques exemples numériques, car vous avez choisi vos chiffres de telle sorte que vous obteniez des réponses assez similaires pour une large gamme de réglages de paramètres différents. Par exemple, supposons, comme vous l'avez dit dans l'un de vos commentaires, que la probabilité que les personnes jugent correctement la couleur d'une voiture est de 0,9. C’est-à-dire: et aussi p ( disons qu'il n'est pas bleu | car n'est pas bleu ) = 0,9 = 1 - p ( disons qu'il est bleu | la voiture n'est pas bleue )
Ceci fait défini, il reste à décider quelle est la probabilité a priori que la voiture soit bleue? Choisissons une probabilité très faible pour voir ce qui se passe et disons que , c'est-à-dire que seulement 0,1% de toutes les voitures sont bleues. Ensuite, la probabilité postérieure que la voiture soit bleue peut être calculée comme suit:p(car is blue)=0.001
Si vous regardez le dénominateur, il est assez clair que le deuxième terme de cette somme sera négligeable, car la taille relative des termes de la somme est dominée par le ratio de à , ce qui est de l'ordre de . Et en effet, si vous effectuez ce calcul sur un ordinateur (en prenant soin d'éviter les problèmes de dépassement numérique), vous obtenez une réponse égale à 1 (avec une précision machine). 0,1 900 10 580.9900 0.1900 1058
La raison pour laquelle les probabilités antérieures importent peu, c'est parce que vous avez tellement de preuves pour une possibilité (la voiture est bleue) par rapport à une autre. Ceci peut être quantifié par le rapport de vraisemblance , que nous pouvons calculer comme :
Ainsi, avant même de considérer les probabilités antérieures, la preuve suggère qu’une option est déjà plus probable astronomiquement que l’autre, et pour que la précédente puisse faire la différence, les voitures bleues devraient être déraisonnablement, stupidement rares (si rares trouver 0 voitures bleues sur la terre).
Et si nous changions le degré de précision des personnes dans leurs descriptions de la couleur de la voiture? Bien sûr, nous pourrions pousser cela à l'extrême et dire qu'ils ne s'en sortent bien que 50% du temps, ce qui n'est pas mieux que de lancer une pièce de monnaie. Dans ce cas, la probabilité postérieure que la voiture soit bleue est simplement égale à la probabilité antérieure, car les réponses des gens ne nous ont rien dit. Mais il est certain que les gens font au moins un peu mieux que cela, et même si on dit que les gens ne sont exacts que 51% du temps, le rapport de vraisemblance reste tel qu’il est environ fois fois plus probable pour la voiture. être bleu.1013
Tout cela est dû aux nombres plutôt importants que vous avez choisis dans votre exemple. Si 9 personnes sur 10 déclaraient que la voiture était bleue, la situation aurait été bien différente, même si le même nombre de personnes se trouvait dans un camp par rapport à l'autre. Parce que les preuves statistiques ne dépendent pas de ce ratio, mais plutôt de la différence numérique entre les factions opposées. En fait, dans le rapport de probabilité (qui quantifie la preuve), les 100 personnes qui disent que la voiture n'est pas bleue annulent exactement 100 des 900 personnes qui disent qu'elle est bleue, c'est donc la même chose que si vous aviez 800 personnes qui étaient d'accord c'était bleu. Et c'est évidemment une preuve assez claire.
(Edit: Comme Silverfish l’a fait remarquer , les hypothèses que j’ai formulées ici impliquaient en réalité que, chaque fois qu’une personne décrit de manière incorrecte une voiture non bleue, elle dira par défaut que c’est une voiture bleue. Cela ne changera rien aux conclusions, car moins il y a de chances que les gens confondent une voiture non bleue avec une voiture bleue, plus il est évident qu’elle est bleue quand ils le disent. Donc, si quelque chose se passe, les chiffres donnés ci-dessus ne sont en réalité qu'une limite inférieure de la preuve pro-bleue.)
la source
La réponse correcte dépend d'informations non spécifiées dans le problème. Vous devrez donc formuler d'autres hypothèses pour obtenir une réponse unique et définitive:
Avec ces informations, nous pouvons tout décomposer avec la formule de Bayes pour obtenir une probabilité postérieure que la voiture soit bleue. Je vais me concentrer sur le cas où nous ne demandons qu'une seule personne, mais le même raisonnement peut être appliqué au cas où vous posez la question à personnes.1000
Nous devons continuer à décomposer davantage , c’est là que le prieur intervient:P( disons est bleu )
Donc, deux applications de la règle de Bayes vous mènent là. Vous devrez déterminer les paramètres non spécifiés en fonction des informations dont vous disposez sur la situation spécifique ou en faisant des hypothèses raisonnables.
Il existe certaines autres combinaisons d’hypothèses que vous pouvez formuler, en fonction:
Au début, vous ne connaissez aucune de ces choses. Vous devez donc faire des hypothèses raisonnables sur trois d'entre elles, puis la quatrième est déterminée à partir de là.
la source
Il existe une hypothèse importante selon laquelle vos 1000 opinions ne partagent pas un parti pris systématique. Ce qui est une hypothèse raisonnable ici, mais pourrait être important dans d'autres cas.
Des exemples pourraient être:
Ce n'est pas probable dans ce cas, mais c'est une hypothèse implicite significative dans d'autres cas. Cela ne doit pas forcément être extrême non plus: transposez votre question dans un autre domaine et ce sera un facteur réel.
Exemples pour chacun où votre réponse peut être affectée par un biais partagé:
Il ne serait pas difficile d’imaginer des questions structurellement identiques dans lesquelles la réponse 900: 100 était une mesure des croyances et de l’honnêteté, ou quelque chose d’autre, sans indiquer la bonne réponse. Pas probable dans ce cas, mais dans d'autres cas - oui.
la source
Une des raisons pour lesquelles vous obtenez des réponses différentes de personnes différentes est que la question peut être interprétée de différentes manières, et ce que vous entendez par «probabilité» n'est pas clair. Une façon de donner un sens à la question consiste à attribuer des a priori et une raison en utilisant la règle de Bayes comme dans la réponse de Matthew.
Avant de demander des probabilités, vous devez décider ce qui est modélisé comme aléatoire et ce qui ne l’est pas. Il n’est pas universellement accepté que des quantités inconnues mais fixes soient affectées à des priorités. Voici une expérience similaire à la vôtre qui met en évidence le problème posé par la question:
la source
the probability is either one or zero, depending on whether the car is actually blue or not.
cela ne correspond pas à une compréhension de la "probabilité" telle que je la connais. Cela ressemble un peu à "X peut arriver ou ne pas arriver, donc la probabilité doit être de 50%". Pouvez-vous préciser un peu plus ce que vous entendez par cette phrase?Réponse simple et pratique:
La probabilité peut facilement aller de 0% à 100% selon vos hypothèses.
Bien que j'aime beaucoup les réponses existantes, cela revient essentiellement à ces deux scénarios simples:
Scénario 1: les gens sont supposés très bien reconnaître le bleu quand il est bleu ... 0%
Dans ce cas, il y a tellement de gens qui affirment que la voiture n'est pas bleue, qu'il est très peu probable que la voiture soit réellement bleue. Par conséquent, la probabilité approche 0%.
Scénario 2: les gens sont supposés très bien reconnaître non-bleu quand ce n'est pas bleu ... 100%
Dans ce cas, il y a tellement de gens qui déclarent que la voiture est bleue, qu'il est très probable qu'elle soit effectivement bleue. La probabilité est donc proche de 100%.
Bien sûr, en commençant par un angle mathématique, vous commenceriez par quelque chose de générique tel que "supposons que les probabilités pertinentes sont ...", ce qui est tout à fait dénué de sens, car de telles choses ne sont généralement pas connues pour des circonstances aléatoires. Par conséquent, je préconise de rechercher les extrêmes pour saisir l’idée que les deux pourcentages peuvent facilement être justifiés par des hypothèses simples et réalistes, et qu’il n’ya donc pas de réponse significative.
la source
Vous devez développer un cadre d’estimation. Certaines questions que vous pourriez poser sont
Combien de couleurs y a-t-il? Parlons-nous de deux couleurs? Ou toutes les couleurs de l'arc-en-ciel?
Quelle est la différence entre les couleurs? Parlons-nous bleu et orange? Ou bleu, cyan et turquoise?
Qu'est-ce que cela signifie d'être bleu? Est-ce que le cyan et / ou le bleu turquoise? Ou juste bleu lui-même?
Dans quelle mesure ces personnes évaluent-elles la couleur? Sont-ils tous des graphistes? Ou sont-ils daltoniens?
D'un point de vue purement statistique, on peut deviner le dernier. Premièrement, nous savons qu'au moins 10% des personnes choisissent une réponse incorrecte. S'il n'y a que deux couleurs (de la première question), alors on pourrait dire qu'il y a
En guise de vérification rapide, si nous additionnons ces éléments, nous obtenons 100%. Vous pouvez voir une notation plus mathématique de ceci à la réponse @MatthewDrury .
Comment pouvons-nous obtenir les 90% dans la troisième? C'est combien de personnes ont dit bleu mais se sont trompées si ce n'est pas le cas. Comme il n'y a que deux couleurs, celles-ci sont symétriques. S'il y avait plus de deux couleurs, alors le risque que le mauvais choix soit pris en bleu quand ils disaient autre chose serait moindre.
Quoi qu’il en soit, cette méthode d’estimation nous donne 90% de bleu. Cela inclut 81% de chances que les gens disent bleu quand c'est le cas et 9% de probabilité que les gens disent que ce n'est pas le cas. C’est probablement ce qui se fait de mieux que nous pouvons arriver à répondre à la question initiale et cela nous oblige à nous fier aux données pour estimer deux choses différentes. Et supposer que la probabilité que le bleu soit choisi est la même chose que la probabilité que le bleu soit correct.
S'il y a plus de deux couleurs, la logique va changer un peu. Les deux premières lignes restent les mêmes, mais nous perdons la symétrie des deux dernières lignes. Dans ce cas, nous avons besoin de plus d’informations. Nous pourrions peut-être estimer la probabilité que le bleu soit correctement redéfini à 81%, mais nous n'avons aucune idée des probabilités que la couleur devienne bleue lorsque quelqu'un dit que ce n'est pas le cas.
Nous pourrions également améliorer même l'estimation des deux couleurs. Avec un nombre statistiquement significatif de voitures de chaque couleur, nous pourrions avoir un nombre statistiquement significatif de personnes qui les regardent et les catégorisent. Ensuite, nous pourrions compter combien de fois les gens ont raison quand ils font chaque choix de couleur et combien de fois ils ont raison pour chaque choix de couleur. Nous pourrions ensuite estimer plus précisément les choix réels des personnes.
Vous pourriez vous demander comment 90% pourraient se tromper. Considérez ce qui se passe s'il y a trois couleurs: bleu azur, bleu et saphir. Quelqu'un pourrait raisonnablement considérer que ces trois éléments sont bleus. Mais nous voulons plus. Nous voulons l'ombre exacte. Mais qui se souvient des noms des autres teintes? Beaucoup pourraient deviner bleu parce que c'est la seule nuance correspondante qu'ils connaissent. Et encore se tromper quand il s'avère être azur.
la source
Une probabilité exacte, mathématique, vraie / fausse ne peut pas être calculée avec les informations que vous fournissez.
Cependant, dans la vraie vie, de telles informations ne sont jamais disponibles avec certitude. Par conséquent, en utilisant notre intuition (et où tout mon argent irait si nous misions), la voiture est définitivement bleue. (Certains pensent que ce ne sont plus des statistiques, mais bon, les points de vue noir / blanc sur la science ne sont pas très utiles)
Le raisonnement est simple. Supposons que la voiture n'est pas bleue. Ensuite, 90% des personnes (!) Se sont trompées. Ils ne peuvent se tromper que par une liste de problèmes comprenant:
Étant donné que ce qui précède n’est clairement pas susceptible d’affecter 90% d’une population aléatoire moyenne (par exemple, le daltonisme touche environ 8% des hommes et 0,6% des femmes, soit 43 personnes sur 1000), c’est nécessairement le cas de la voiture. bleu. (C’est là que tout mon argent irait de toute façon).
la source
Je ne mangerais pas les matières fécales en raison du fait que des milliards de mouches ne peuvent pas avoir tort. Il pourrait y avoir des dizaines d'autres raisons pour lesquelles 900 personnes sur 1000 pourraient avoir été trompées en pensant que la voiture est bleue. Après tout, c’est la base des tours de magie, qui incitent les gens à penser que quelque chose est éloigné de la réalité. Si 900 personnes sur 1 000 voient un magicien poignarder son assistant, ils répondront rapidement que l'assistant a été poignardé, à quel point un homicide est improbable sur la scène. Une lumière bleue sur une peinture automobile réfléchissante, ça vous tente?
la source
La personne interrogée en sait trop peu sur la manière dont le sondage a été effectué pour pouvoir répondre à la question avec précision. En ce qui le concerne, le sondage peut avoir plusieurs problèmes:
Les personnes qui ont participé au sondage auraient pu être biaisées:
La voiture avait l'air bleue à cause d'une illusion d'optique .
La couleur de la voiture était difficile à observer pour une raison quelconque, et beaucoup de voitures bleues avaient déjà été montrées à la population avant celle-ci.
Vous les aviez payés pour dire que la voiture était bleue.
Vous avez eu quelqu'un qui les hypnotisait tous en leur faisant croire que la voiture était bleue.
Ils avaient conclu un pacte pour mentir et saboter le scrutin.
Il peut y avoir eu des corrélations entre les personnes participant au sondage en raison de la manière dont elles ont été sélectionnées ou de l'influence qu'elles se sont mutuellement affectées:
Vous avez accidentellement effectué le sondage lors d’une réunion de masse pour des personnes atteintes du même type de daltonisme.
Vous avez effectué le sondage dans les jardins d'enfants; la voiture n’intéressait pas les filles et la plupart des garçons avaient le bleu comme couleur préférée, ce qui leur donnait l’imagination.
La première personne à qui on a montré la voiture était en état d'ébriété et a pensé qu'elle avait l'air bleue, elle a crié "C'EST BLEU", ce qui a poussé tous les autres à penser que la voiture était bleue.
Ainsi, alors que la probabilité que la voiture soit bleue si le scrutin a été correctement effectué est extrêmement élevée (comme expliqué dans la réponse de Ruben van Bergen), la fiabilité du sondage peut avoir été compromise, ce qui fait en sorte que la voiture n'est pas bleue. insignifiant. La taille de la personne interrogée estime que cette chance sera finalement dépendante de son estimation de la probabilité que les circonstances fassent échouer le sondage et de la qualité de votre conduite du scrutin (et de la malhonnêteté dont il pense avoir été victime).
la source
Quelle est la définition de "bleu"?
Différentes cultures et langues ont différentes notions de bleu. IIRC, certaines cultures incluent le vert dans leur notion de bleu!
Comme tout mot de langage naturel, vous ne pouvez que supposer qu'il existe une convention culturelle sur le moment (et le cas contraire) d'appeler les choses "bleues".
Dans l’ensemble, la couleur dans le langage est étonnamment subjective (lien tiré des commentaires ci-dessous, merci @Count Ibilis)
la source
La probabilité pourrait, selon des conditions préalables plus précises, être plusieurs valeurs différentes, mais 99,995% est celle qui a le plus de sens pour moi.
Nous savons, par définition, que la voiture est bleue (c'est à 100%), mais ce que cela signifie réellement n'est pas bien précisé (cela parierait un peu philosophique). Je supposerai que quelque chose est bleu dans le sens où l'on peut vraiment être vu comme tel.
Nous savons également que 90% des sujets testés l'ont signalé en bleu.
Nous ne savons pas ce qui a été demandé, ni comment l'évaluation a été effectuée, ni dans quelles conditions d'éclairage se trouvait la voiture. Lorsqu'on a demandé à nommer la couleur, certains sujets auraient par exemple pu dire "bleu verdâtre" en raison des conditions d'éclairage, et l'évaluateur pourrait ne pas avoir compté cela comme "bleu". Les mêmes personnes auraient peut-être répondu "oui" si la question était "Est-ce que c'est bleu?". Je supposerai que vous n'aviez pas l'intention de tromper malicieusement vos sujets de test.
Nous savons que l’incidence de la tritanopie est d’environ 0,005%, ce qui signifie que si la voiture pouvait être considérée comme bleue , alors 99,995% des sujets du test ont effectivement vu la couleur bleue. Cela signifie toutefois que 9,995% des sujets de test n'ont pas signalé de bleu lorsqu'ils ont clairement vu le bleu. Ils mentaient à propos de ce qu'ils ont vu. Ceci est proche de ce que votre expérience de vie vous dit aussi: les gens ne sont pas toujours honnêtes (mais, à moins d’un motif, ils le sont généralement).
Ainsi, le non-observateur peut supposer avec une certitude accablante que la voiture est bleue. Ce serait 100%
Sauf que ... sauf si la personne qui n'observe pas elle-même souffre de tritanopie, dans ce cas, elle ne verrait pas la voiture comme bleue, même si tout le monde (ou plutôt 90% d'entre eux) le dit. Ici, cela redevient philosophique: si tout le monde a entendu un arbre tomber, mais pas moi, est-ce qu'il est tombé?
Je pense que la réponse la plus raisonnable et la plus pratique serait: Si la personne qui n'observe pas se trouve être un trianope (0,005% de chance), alors vérifier si la couleur prédite et la couleur réelle sont identiques est faux. Ainsi, la probabilité est de 99,995% plutôt que 100%.
De plus, en bonus, puisque nous avons découvert que 9,995% des sujets de test sont des menteurs et qu'il est connu que tous les Crétois sont des menteurs , nous pouvons en conclure que nous ne sommes pas en Crète!
la source
C'est 100% bleu.
Utiliser ces chiffres (sans aucun contexte) est totalement insensé. Tout se résume à une interprétation personnelle de la question. Nous ne devrions pas emprunter ce chemin et utiliser celui de Wittgenstein: "Wovon man nicht sprechen kann, darüber muss man schweigen."
Imaginez la question suivante pour la comparaison:
C’est fondamentalement le même problème (information moins), mais il est beaucoup plus clair que ce que nous pensons de la couleur de la voiture est essentiellement (sinon complètement) circonstanciel.
À long terme, lorsque nous avons plusieurs questions associées, nous pouvons alors commencer à deviner les réponses à ces questions incomplètes. Il en va de même pour l’algorithme tit-pour-tat qui ne fonctionne pas dans un seul cas, mais fonctionne à long terme . Dans le même sens, Wittgenstein est revenu de ses travaux antérieurs avec ses enquêtes principales . Nous sommes en mesure de répondre à ces questions, mais nous avons besoin de plus d’informations / essais / questions. C'est un processus.
la source
Si nous supposons que la voiture est bleue, alors 100 sur 1 000 affirmant qu'elle n'est pas bleue impliquent un biais d'échantillon extrême. Peut-être n’avez-vous échantillonné que des daltoniens? Si nous supposons que la voiture n'est pas bleue, le biais de l'échantillon est encore pire. Nous ne pouvons donc que conclure des données fournies que l’échantillon est très biaisé, et comme nous ne savons pas comment il était biaisé, nous ne pouvons rien conclure à propos de la couleur de la voiture.
la source
Il y a eu des réponses. Je ne suis en aucun cas un gourou des mathématiques, mais bon, voici le mien.
Il ne peut y avoir que 4 possibilités:
D'après la question, vous savez que la somme des cas 1 et 4 est de 900 personnes (90%) et que la somme des cas 2 et 3 est de 100 personnes (10%). Cependant, voici le piège: ce que vous ne savez pas, c'est la distribution entre ces 2 paires de cas. Peut-être que la somme des cas 1 et 4 est entièrement composée du cas 1 (ce qui signifie que la voiture est bleue), ou peut-être que la somme totale est composée du cas 4 (qui signifie que la voiture n'est pas bleue). Il en va de même pour la somme des cas 2 + 3. Alors… Ce dont vous avez besoin, c'est de trouver un moyen de prédire la distribution dans les sommes au cas par cas. Sans autre indication dans la question (nulle part, il est dit que les gens sont certains à 80% de connaître leurs couleurs ou quoi que ce soit de ce genre), il est impossible de trouver une réponse précise et définitive.
Cela dit, je soupçonne que la réponse attendue va dans le sens de:
où les 50% restants sont simplement inconnus, appelez cela la marge d'erreur.
la source
la source
La personne qui ne peut pas voir la voiture ne sait pas qu'il est scientifiquement prouvé qu'elle est bleue. La probabilité que la voiture soit bleue est de 50/50 (elle est bleue ou elle ne l’est pas). Interroger d'autres personnes peut influencer l'opinion de cette personne, mais cela ne change en rien la probabilité qu'une voiture invisible soit bleue ou non.
Tous les calculs ci-dessus déterminent la probabilité que votre ensemble d'échantillons puisse déterminer s'il est bleu.
la source