Il y a une personne derrière un rideau - je ne sais pas s'il s'agit d'une femme ou d'un homme.
Je sais que la personne a les cheveux longs et que 90% des personnes ayant les cheveux longs sont des femmes
Je sais que la personne a un groupe sanguin rare AX3 et que 80% de toutes les personnes de ce groupe sanguin sont des femmes.
Quelle est la probabilité que la personne soit une femme?
REMARQUE: cette formulation originale a été complétée par deux autres hypothèses: 1. Le groupe sanguin et la longueur des cheveux sont indépendants. 2. Le ratio homme: femme dans la population générale est de 50:50.
(Le scénario spécifique ici n’est pas aussi pertinent. Au lieu de cela, j’ai un projet urgent qui nécessite de bien comprendre l’approche correcte pour répondre à cette question. J’ai le sentiment que c’est une question de simple probabilité, avec une simple réponse définitive, plutôt que quelque chose avec plusieurs réponses discutables selon différentes théories statistiques))
la source
Réponses:
De nombreuses personnes trouvent utile de penser en termes de "population", de sous-groupes et de proportions (plutôt que de probabilités). Cela se prête au raisonnement visuel.
J'expliquerai les chiffres en détail, mais l'objectif est qu'une comparaison rapide des deux chiffres indique immédiatement et de manière convaincante comment et pourquoi aucune réponse spécifique à la question ne peut être donnée. Un examen un peu plus long suggérera quelles informations supplémentaires seraient utiles pour déterminer une réponse ou au moins pour obtenir des limites sur les réponses.
Légende
Hachures croisées : femme / Fond plein : homme.
En haut : poils longs / En bas : poils courts.
Droite (et colorée) : AX3 / Gauche (non colorée) : non-AX3.
Les données
Le quadrillage supérieur correspond à 90% du rectangle supérieur ("90% des personnes ayant les cheveux longs sont des femmes").
Les hachures totales dans le rectangle de couleur de droite représentent 80% de ce rectangle ("80% des personnes de ce groupe sanguin sont des femmes").
Explication
Ce diagramme montre de manière schématique comment la population (de toutes les femmes et des non-femmes considérées) peut être simultanément divisée en femmes / non-femmes, AX3 / non-AX3 et cheveux longs / non longs. Il utilise la surface, au moins approximativement, pour représenter les proportions (il y a une exagération pour rendre la photo plus claire).
Il est évident que ces trois classifications binaires créent huit groupes possibles. Chaque groupe apparaît ici.
Les informations fournies indiquent que le rectangle supérieur hachuré (femelles aux cheveux longs) comprend 90% du rectangle supérieur (toutes les personnes aux cheveux longs). Il indique également que les parties hachurées combinées des rectangles colorés (les femelles aux cheveux longs avec AX3 et les femelles aux cheveux courts avec AX3) représentent 80% de la région colorée à droite (toutes les personnes atteintes de AX3). On nous dit que quelqu'un se trouve dans le coin supérieur droit (flèche): les personnes aux cheveux longs avec AX3. Quelle proportion de ce rectangle est hachurée (femelle)?
J'ai également supposé (implicitement) que le groupe sanguin et la longueur des cheveux sont indépendants : la proportion du rectangle supérieur (cheveux longs) qui est colorée (AX3) est égale à la proportion du rectangle inférieur (cheveux courts) qui est colorée (AX3). C'est ce que signifie l'indépendance. C'est une hypothèse juste et naturelle à faire lorsque l'on aborde de telles questions, mais il faut bien sûr le préciser.
La position du rectangle quadrillé supérieur (femelles aux cheveux longs) est inconnue. Nous pouvons imaginer faire glisser le rectangle hachuré supérieur d'un côté à l'autre et le rectangle hachuré inférieur d'un côté à l'autre et éventuellement en modifier la largeur. Si nous faisons cela pour que 80% du rectangle coloré reste hachuré, une telle modification ne changera en rien l'information indiquée, mais cela pourrait modifier la proportion de femmes dans le rectangle supérieur droit. À l’évidence, cette proportion pourrait se situer entre 0% et 100% tout en restant cohérente avec l’information donnée, comme dans cette image:
L'un des points forts de cette méthode est qu'elle établit l'existence de réponses multiples à la question. On pourrait traduire tout cela algébriquement et, au moyen de stipulations de probabilités, proposer des situations spécifiques comme exemples possibles, mais la question se poserait alors de savoir si de tels exemples sont vraiment cohérents avec les données. Par exemple, si quelqu'un suggère que AX3 représente peut-être 50% des personnes aux cheveux longs, il n'est pas évident au départ que cela soit même possible compte tenu de toutes les informations disponibles. Ces diagrammes (Venn) de la population et de ses sous-groupes rendent ces choses claires.
la source
la source
Discussion fascinante! Je me demande si nous avons également spécifié P (A) et P (B) si les plages de P (C | A, B) ne seront pas beaucoup plus étroites que l'intervalle complet [0,1], simplement en raison des nombreuses contraintes on a.
S'en tenir à la notation introduite ci-dessus:
A = l'événement que la personne a les cheveux longs
B = l'événement où la personne a un groupe sanguin AX3
C = l'événement auquel cette personne est une femme
P (C | A) = 0,9
P (C | B) = 0,8
P (C) = 0,5 (supposons un ratio égal d'hommes et de femmes dans la population)
puis
4. (trivial) Le rectangle supérieur ne peut pas être déplacé au-delà de la limite gauche et ne doit pas être déplacé au-delà de son chevauchement minimal à gauche.
5. (trivial) Le rectangle inférieur ne peut pas être déplacé au-delà de la limite droite et ne doit pas être déplacé au-delà de son chevauchement maximal à droite.
Ce graphique permet de parcourir une plage de valeurs possibles pour P (A) et P (B) ( script R ).
En conclusion, nous pouvons réduire la probabilité conditionnelle P (c | A, B) pour P (A), P (B) donné
la source
Faire l'hypothèse est que la personne derrière un rideau est une femme.
Nous avons donné 2 éléments de preuve, à savoir:
Preuve 1: Nous savons que la personne a les cheveux longs (et on nous dit que 90% des personnes ayant les cheveux longs sont des femmes)
Preuve 2: Nous savons que la personne a un groupe sanguin rare AX3 (et on nous dit que 80% de toutes les personnes de ce groupe sanguin sont des femmes)
À partir de la première preuve 1, nous pouvons affirmer que la personne derrière un rideau a une probabilité de 0,9 d’être une femme (en supposant une répartition 50:50 entre hommes et femmes).
En ce qui concerne la question posée précédemment dans le fil, à savoir "Seriez-vous d'accord pour dire que la réponse doit être supérieure à 0,9?", Sans faire de calcul, je dirais intuitivement que la réponse doit être "oui" (supérieure à 0,9). La logique est que Evidence 2 est une preuve à l'appui (encore une fois, en supposant un partage 50:50 pour le nombre d'hommes et de femmes dans le monde). Si on nous disait que 50% de toutes les personnes atteintes du sang de type AX3 étaient des femmes, alors la preuve 2 serait neutre et n'aurait pas d'incidence. Mais comme on nous dit que 80% de toutes les personnes de ce groupe sanguin sont des femmes, Evidence 2 apporte des preuves à l'appui et devrait logiquement augmenter la probabilité finale qu'une femme soit au-dessus de 0,9.
Pour calculer une probabilité spécifique, nous pouvons appliquer la règle de Bayes pour la preuve 1, puis utiliser la mise à jour bayésienne pour appliquer la preuve 2 à la nouvelle hypothèse.
Supposer:
A = l'événement que la personne a les cheveux longs
B = l'événement où la personne a un groupe sanguin AX3
C = l'événement où cette personne est une femme (supposons 50%)
Application de la règle de Bayes à la preuve 1:
P (C | A) = (P (A | C) * P (C)) / P (A)
Dans ce cas, encore une fois si nous supposons une répartition 50:50 entre hommes et femmes:
P (A) = (0,5 * 0,9) + (0,5 * 0,1) = 0,5
Donc, P (C | A) = (0.9 * 0.5) / 0.5 = 0.9 (Pas étonnant, mais ce serait différent si nous n'avions pas de partage 50:50 entre hommes et femmes)
En utilisant la mise à jour bayésienne pour appliquer Evidence 2 et en connectant la 0.9 à la nouvelle probabilité antérieure, nous avons:
P (C | A ET B) = (P (B | C) * 0,9) / P (E)
Ici, P (E) est la probabilité de preuve 2, étant donné l’hypothèse que la personne a déjà 90% de chances d’être une femme.
P (E) = (0.9 * 0.8) + (0.1 * 0.2) [loi de probabilité totale: (P (femme) * P (AX3 | femme) + P (homme) * P (AX3 | homme)] Donc , P (E) = 0,74
Donc, P (C | A ET B) = (0,8 * 0,9) / 0,74 = 0,97297
la source
Restitution des questions et généralisation
Réponses
Cas 1
Il a été démontré par divers moyens ésotériques que la distribution à affecter lorsque les informations ne déterminent pas autrement une solution est celle qui, parmi toutes les distributions compatibles avec les informations connues, présente la plus grande entropie. Toute autre distribution implique que nous en sachions plus que les informations connues, ce qui est bien sûr une contradiction.
Cas 2
Cas 3
Cas 4
la source
Je crois maintenant que, si nous supposons une proportion d'hommes et de femmes dans la population en général, il n'y a alors qu'une seule réponse indiscutable.
A = l'événement que la personne a les cheveux longs
B = l'événement où la personne a un groupe sanguin AX3
C = l'événement auquel cette personne est une femme
P (C | A) = 0,9
P (C | B) = 0,8
P (C) = 0,5 (supposons un ratio égal d'hommes et de femmes dans la population)
Alors P (C | A et B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]
dans ce cas, P (C | A et B) = 0,972973
la source
Remarque: pour obtenir une réponse définitive, les réponses ci-dessous supposent que la probabilité qu'une personne, un homme à cheveux longs et une femme à cheveux longs, soit porteur de AX3 soit approximativement la même chose. Si plus de précision est souhaitée, cela doit être vérifié.
Vous commencez avec la connaissance que la personne a les cheveux longs, donc à ce stade, les chances sont:
Remarque:
le rapport entre les hommes et les femmes dans la population générale ne nous importe pas une fois que nous avons découvert que la personne avait les cheveux longs. Par exemple, s'il y avait 1 femme sur 100 dans la population en général, une personne aux cheveux longs sélectionnée au hasard serait toujours une femme 90% du temps.Le rapport femmes / hommes importe! (voir la mise à jour ci-dessous pour plus de détails)Ensuite, nous apprenons que la personne a AX3. Comme AX3 n’est pas lié aux cheveux longs, on sait que le rapport hommes-femmes est de 50:50, et comme nous supposons que les probabilités sont les mêmes, nous pouvons simplement multiplier chaque côté de la probabilité et normaliser afin que la somme de les côtés de la probabilité est égal à 100:
Ainsi, la probabilité que la personne derrière le rideau soit une femme est d'environ 97,297%.
MISE À JOUR
Voici une exploration plus poussée du problème:
Définitions:
Premièrement, on nous dit que 90% des personnes aux cheveux longs sont des femmes et que 80% des personnes atteintes d'AX3 sont des femmes, donc:
Parce que nous avons supposé que la probabilité de AX3 était indépendante du sexe et des cheveux longs, notre pfx calculé s'appliquera aux femmes aux cheveux longs, et pmx aux hommes ayant les cheveux longs pour trouver le nombre de ceux qui ont probablement AX3:
Ainsi, le rapport probable entre le nombre de femmes ayant les cheveux longs et AX3 et le nombre d’hommes ayant les cheveux longs et AX3 est égal à:
Comme il est donné qu'il y a un nombre égal de 50:50, vous pouvez annuler les deux côtés et terminer avec 36 femmes pour chaque homme. Sinon, il y a 36 * m / f femelles pour chaque mâle du sous-groupe spécifié. Par exemple, s'il y avait deux fois plus de femmes que d'hommes, il y aurait 72 femmes pour chaque homme parmi ceux qui ont les cheveux longs et AX3.
la source
98% de femmes, interpolation simple. Première prémisse 90% de femmes, laisse 10%, deuxième prémisse ne laisse que 2% des 10% existants, donc 98% de femmes
la source