P(B)n ( A B ) / n ( A ) > n (..."/>

Si «B est plus probable étant donné A», alors «A est plus probable étant donné B»

9

J'essaie d'avoir une intuition plus claire derrière: "Si rend plus probable alors rend plus probable" ieABBA

Soit la taille de l'espace dans lequel se trouvent et , puisn(S)AB

Revendication: doncP(B|A)>P(B)n(AB)/n(A)>n(B)/n(S)

doncn(AB)/n(B)>n(A)/n(S)

qui estP(A|B)>P(A)

Je comprends les mathématiques, mais pourquoi cela a-t-il un sens intuitif?

Rahul Deora
la source
1
J'ai modifié la question pour supprimer le mot «faire». Cette question ressemblait un peu à ces questions ambiguës sur Facebook, celles où vous devez résoudre une somme algébrique avec des images et les gens obtiennent des réponses très différentes en raison des différentes interprétations de la question. Ce n'est pas quelque chose que nous voulons ici. (une alternative est de fermer la question pour manque de clarté et de la faire changer par le PO).
Sextus Empiricus

Réponses:

10

À titre d'intuition, des exemples concrets tels que ceux de Peter Flom sont très utiles pour certaines personnes. L'autre chose qui aide généralement les gens, ce sont les photos. Donc, pour couvrir la plupart des bases, ayons quelques photos.

Diagramme de probabilité conditionnelle montrant l'indépendance Diagramme de probabilité conditionnelle montrant la dépendance

Nous avons ici deux diagrammes très basiques montrant les probabilités. Le premier montre deux prédicats indépendants que j'appellerai Red et Plain. Il est clair qu'ils sont indépendants car les lignes s'alignent. La proportion de zone unie qui est rouge est la même que la proportion de zone rayée qui est rouge et est également la même que la proportion totale qui est rouge.

Dans la deuxième image, nous avons des distributions non indépendantes. Plus précisément, nous avons étendu une partie de la zone rouge uni dans la zone rayée sans changer le fait qu'elle soit rouge. De toute évidence, le fait d'être rouge rend la plaine plus probable.

Pendant ce temps, jetez un œil au côté simple de cette image. Il est clair que la proportion de la zone unie qui est rouge est supérieure à la proportion de l'image entière qui est rouge. C'est parce que la région de la plaine a reçu un tas plus de surface et tout cela est rouge.

Ainsi, le rouge rend le plaine plus probable et le plaine le rend plus probable.

Que se passe-t-il réellement ici? A est une preuve de B (c'est-à-dire que A rend B plus probable) lorsque la zone qui contient à la fois A et B est plus grande que ce qui serait prévu si elles étaient indépendantes. Parce que l'intersection entre A et B est la même que l'intersection entre B et A, cela implique également que B est la preuve de A.

Une mise en garde: bien que l'argument ci-dessus semble très symétrique, il se peut que la force des preuves dans les deux sens ne soit pas égale. Par exemple, considérez cette troisième image. Ici, la même chose s'est produite: le rouge uni a dévoré un territoire qui appartenait auparavant au rouge rayé. En fait, il a complètement terminé le travail!Diagramme de probabilité conditionnelle montrant une dépendance extrême

Notez que le point étant purement rouge garantit la netteté car il n'y a plus de régions rouges rayées. Cependant, un point clair n'a pas garanti la rougeur, car il reste encore des régions vertes. Néanmoins, un point dans la boîte étant simple augmente les chances qu'il soit rouge, et un point rouge augmente les chances qu'il soit clair. Les deux directions impliquent plus probablement, mais pas du même montant.

Josiah
la source
J'aime les images :) Cependant, il semble que ce soit les images ou l'explication est inversée: In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. - votre deuxième image a gagné une zone simple que la première, donc en passant de l'image 1 à 2, nous avons déplacé la zone plate dans la zone rayée.
Pod
Donc, si j'ai un diagramme venn avec une zone d'intersection A, B commune et tout ce que je fais est d'augmenter cette zone d'intersection, j'ajoute automatiquement plus A, B pour tout l'espace (sans agrandir l'espace) et je change / augmente n (A ) / n (S) et n (B) / n (S) en conséquence. Droite? Plus de commentaires?
Rahul Deora
4
Le rouge contre le vert est une combinaison problématique pour les personnes daltoniennes.
Richard Hardy
@Pod Je pense que c'est une ambiguïté de langage naturel que vous décrivez. Lire "nous avons déplacé une partie de la zone rayée rouge dans la zone de plaine" comme "nous avons déplacé une partie de la zone anciennement connue sous le nom de bande rouge et l' avons changé en zone de plaine". Je pense que vous l'avez mal interprété comme "nous avons étendu une partie de la zone rouge rayée dans la zone anciennement connue sous le nom de plaine" .
Peter - Réintègre Monica le
20

Je pense qu'une autre façon mathématique de le dire peut aider. Considérons la demande dans le contexte de la règle de Bayes:

Affirmation: si alorsP(B|A)>P(B)P(A|B)>P(A)

Règle de Bayes:

P(AB)=P(BA)P(A)P(B)

en supposant que non nul. DoncP(B)

P(A|B)P(A)=P(B|A)P(B)

Si P(B|A)>P(B) , alors P(B|A)P(B)>1.

Alors P(A|B)P(A)>1, et doncP(A|B)>P(A).

Cela prouve l'affirmation et une conclusion encore plus forte - que les proportions respectives des probabilités doivent être égales.

Aaron Hall
la source
J'ai aimé cela car cela montre le lien plus fort "si A rend B x pour cent plus probable, alors B rend A x pour cent plus probable"
probabilislogique
@probabilityislogic La formulation de cette façon introduit une ambiguïté. Si la probabilité antérieure est de 10% et que la valeur postérieure est de 15%, la probabilité a-t-elle augmenté de 5% (15% moins 10%) ou 50% (15% divisé par 10%)?
Accumulation
P(B|A)>P(B)P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)
12

Eh bien, je n'aime pas le mot «fait» dans la question. Cela implique une sorte de causalité et la causalité ne s'inverse généralement pas.

Mais vous avez demandé l'intuition. Donc, je penserais à quelques exemples, car cela semble susciter l'intuition. Choisissez celui que vous aimez:

Si une personne est une femme, il est plus probable qu'elle ait voté pour un démocrate.
Si une personne a voté pour un démocrate, il est plus probable qu'elle soit une femme.

Si un homme est un centre de basket-ball professionnel, il est plus probable qu'il mesure plus de 2 mètres.
Si un homme mesure plus de 2 mètres, il est plus probable qu'il soit un centre de basket-ball.

S'il fait plus de 40 degrés Celsius, il est plus probable qu'il y ait une panne d'électricité.
S'il y a eu une panne d'électricité, il est plus probable qu'elle dépasse 40 degrés.

Etc.

Peter Flom
la source
4
Ce n'est pas une question de probabilité. Cela représente environ 1 à 1 relations.
Peter Flom
6
@jww Imaginez l'énoncé "s'il pleut, la rue est mouillée" (et supposez que c'est une implication valable pour le moment, alors que l'inverse ne l'est pas). Maintenant, prenez un grand nombre d '"échantillons" à différents moments et endroits, où vous enregistrez s'il pleut et si la rue est mouillée. La rue sera mouillée dans plus d'échantillons où il pleut que d'échantillons là où il n'y en a pas; mais aussi , il pleuvra dans plus d'échantillons où la rue est mouillée que dans les échantillons où la rue est sèche. Voilà la probabilité.
hobbs
3
Les deux phénomènes sont causés par la même implication; l'implication ne fonctionne que dans un sens, mais en observant les conséquences, il est plus probable que vous regardiez un échantillon où l'antécédent est vrai.
hobbs
7
@Barmar Désolé, mais cela démontre en partie l'exactitude de ma logique. Parce que disons 36/25 000, c'est beaucoup plus que 1/150 000 000.
Peter Flom
7
Plus probable que quelqu'un qui mesure moins de 2 mètres de haut.
Peter Flom
9

P(A)>0,P(B)>0

η(A,B)=P(AB)P(A)P(B)
ηABAB

P(AB)P(A)P(B)>1P(BA)>P(B)P(AB)P(A)P(B)ABABP(AB)>P(A)η(A,B)AB

La réponse de @gunes a donné un exemple pratique, et il est facile d'en faire d'autres de la même manière.

kjetil b halvorsen
la source
2

Si A rend B plus probable, cela signifie que les événements sont liés d'une manière ou d'une autre. Cette relation fonctionne dans les deux sens.

Si A rend B plus probable, cela signifie que A et B ont tendance à se produire ensemble. Cela signifie alors que B rend également A plus probable.

Dasherman
la source
1
Cela pourrait peut-être utiliser une certaine expansion? Sans définition de connexe, c'est un peu vide.
mdewey
2
J'essayais de rester loin de tout ce qui était rigoureux, car OP a demandé une explication intuitive. Vous avez raison, il est tout à fait vide comme il l'est maintenant, mais je ne sais pas comment le développer de manière intuitive. J'ai ajouté une tentative.
Dasherman
2

Si A rend B plus probable, A dispose d'informations cruciales que B peut inférer sur lui-même. Malgré le fait qu'il ne contribue peut-être pas au même montant, ces informations ne sont pas perdues dans l'autre sens. Finalement, nous avons deux événements que leur occurrence se soutiennent mutuellement. Je n'arrive pas à imaginer un scénario où l'occurrence de A augmente la probabilité de B et l'occurrence de B diminue la probabilité de A. Par exemple, s'il pleut, le sol sera mouillé avec une forte probabilité, et si le sol est humide, cela ne veut pas dire qu'il a plu mais cela ne diminue pas les chances.

gunes
la source
2

Vous pouvez rendre les calculs plus intuitifs en imaginant un tableau de contingence.

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • AB

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    P(A)=P(A|B)P(B)=P(B|A)

  • a,b,c,d±z

    A¬A1x1xBya+zbz¬B1yczd+z

    z

    P(A|B)P(A)P(B|A)P(B)>z<z

P(A|B)>P(A)P(B|A)>P(B)P(B,A)>P(A)P(B)

Si A et B se produisent souvent ensemble (la probabilité conjointe est plus élevée que le produit des probabilités marginales), l'observation de l'une augmentera la probabilité (conditionnelle) de l'autre.

Sextus Empiricus
la source
2

Supposons que nous désignons le rapport de probabilité postérieur à antérieur d'un événement comme:

Δ(A|B)P(A|B)P(A)

Ensuite, une autre expression du théorème de Bayes (voir cet article connexe ) est:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

BAAB


ABdo

Ben - Réintègre Monica
la source
1

On vous dit que Sam est une femme et Kim est un homme, et l'un des deux porte du maquillage et l'autre pas. Selon vous, qui d'entre eux porte du maquillage?

On vous dit que Sam porte du maquillage et Kim non, et l'un des deux est un homme et l'autre est une femme. Qui devinez-vous est la femme?

Hagen von Eitzen
la source
Il n'est pas si simple de le connecter au problème d'origine. Qu'est-ce que l'événement A et qu'est-ce que l'événement B? Ici, cela ressemble plus à une comparaison des probabilités. L'événement A est «x est une femme» (pas A est l'événement «x est un homme»). Et l'événement B est «x porte du maquillage». Mais maintenant, nous avons soudainement un Sam et un Kim, d'où cela vient-il et devrions-nous utiliser quoi que ce soit d'informations sur la masculinité subjective ou la féminité de leurs noms?
Sextus Empiricus
1

Il semble qu'il y ait une certaine confusion entre la causalité et la corrélation. En effet, l'énoncé de la question est faux pour la causalité, comme le montre un exemple tel que:

  • Si un chien porte un foulard, c'est un animal domestique.

Ce qui suit n'est pas vrai:

  • Voir un animal domestique portant un foulard implique qu'il s'agit d'un chien.
  • Voir un chien domestique implique qu'il porte un foulard.

Cependant, si vous pensez aux probabilités (corrélation), alors c'est vrai:

  • Les chiens portant des écharpes sont beaucoup plus susceptibles d'être un animal domestique que les chiens ne portant pas d'écharpes (ou les animaux en général d'ailleurs)

Ce qui suit est vrai:

  • Un animal domestique portant un foulard est plus susceptible d'être un chien qu'un autre animal.
  • Un chien domestique est plus susceptible de porter un foulard qu'un chien non domestique.

Si ce n'est pas intuitif, pensez à un bassin d'animaux comprenant des fourmis, des chiens et des chats. Les chiens et les chats peuvent tous deux être domestiqués et porter des écharpes, les fourmis non plus.

  1. Si vous augmentez la probabilité d'animaux domestiques dans votre piscine, cela signifie également que vous augmenterez les chances de voir un animal portant un foulard.
  2. Si vous augmentez la probabilité de chats ou de chiens, vous augmenterez également la probabilité de voir un animal portant un foulard.

Être domestiqué est le lien "secret" entre l'animal et le port d'un foulard, et ce lien "secret" exercera son influence dans les deux sens.

Edit: Donner un exemple à votre question dans les commentaires:

Imaginez un monde où les animaux sont des chats ou des chiens. Ils peuvent être domestiqués ou non. Ils peuvent porter un foulard ou non. Imaginez qu'il existe 100 animaux au total, 50 chiens et 50 chats.

Considérez maintenant la déclaration A comme suit : "Les chiens portant des écharpes sont trois fois plus susceptibles d'être un animal domestique que les chiens ne portant pas d'écharpes ".

Si A n'est pas vrai, vous pouvez imaginer que le monde pourrait être composé de 50 chiens, dont 25 domestiqués (dont 10 portant des écharpes), 25 sauvages (dont 10 portant des écharpes). Mêmes statistiques pour les chats.

Ensuite, si vous voyiez un animal domestique dans ce monde, il aurait 50% de chances d'être un chien (25/50, 25 chiens sur 50 animaux domestiques) et 40% de chance d'avoir un foulard (20/50, 10 chiens et 10 chats sur 50 animaux domestiques).

Cependant, si A est vrai, alors vous avez un monde où il y a 50 chiens, 25 d'entre eux domestiqués (dont 15 portent des écharpes ), 25 sauvages (dont 5 portent des écharpes ). Les chats conservent les anciennes statistiques: 50 chats, dont 25 domestiques (dont 10 portant des écharpes), 25 sauvages (dont 10 portant des écharpes).

Ensuite, si vous voyiez un animal domestique dans ce monde, il aurait 50% de chances d'être un chien (25/50, 25 chiens sur 50 animaux domestiques) mais aurait 50% (25/50, 15 chiens et 10 chats sur 50 animaux domestiques).

Comme vous pouvez le voir, si vous dites que A est vrai, alors si vous avez vu un animal domestique portant un foulard dans le monde, il serait plus probable qu'un chien (60% ou 15/25) que tout autre animal (dans ce cas Cat, 40% ou 10/25).

H4uZ
la source
C'est la ligne que j'ai un problème avec "Un animal domestique portant un foulard est plus susceptible d'être un chien qu'un autre animal." Lorsque nous avons fait notre déclaration initiale, nous n'avons fait aucune réclamation sur les autres animaux qui pouvaient porter des écharpes. Il pourrait y avoir des centaines. Nous avons seulement fait une déclaration sur les chiens.
Rahul Deora
Voyez si ma modification vous aide à résoudre votre problème particulier.
H4uZ
0

Il y a ici une confusion entre causalité et corrélation. Je vais donc vous donner un exemple où exactement le contraire se produit.

Certaines personnes sont riches, d'autres sont pauvres. Certaines personnes pauvres reçoivent des prestations, ce qui les rend moins pauvres. Mais les personnes qui reçoivent des prestations sont encore plus susceptibles d'être pauvres, même avec des prestations.

Si vous bénéficiez d'avantages, il est plus probable que vous puissiez vous permettre des billets de cinéma. ("Le rend plus probable" signifie la causalité). Mais si vous pouvez vous permettre des billets de cinéma, cela rend moins probable que vous soyez parmi les personnes assez pauvres pour obtenir des avantages, donc si vous pouvez vous permettre des billets de cinéma, vous êtes moins susceptible d'en bénéficier.

gnasher729
la source
5
Ce n'est pas une réponse à la question. Intéressant, mais pas une réponse. En fait, il s'agit d'un scénario différent; la raison inverse se produit parce qu'il utilise deux mesures différentes qui sont nommées de la même manière (pauvres sans avantages vs pauvres avec avantages) et en tant que tel, c'est un scénario complètement différent.
wizzwizz4
0

L'intuition devient claire si vous regardez l'énoncé le plus fort:

Si A implique B, alors B rend A plus probable.

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

De toute évidence, A est plus susceptible d'être vrai si B est également connu pour être vrai, car si B était faux, il en serait de même pour A. La même logique s'applique à l'énoncé le plus faible:

Si A rend B plus probable, alors B rend A plus probable.

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true
Rainer P.
la source
Je pense que ce que vous dites dans la première déclaration est que dans un diagramme de Venn si A est contenu dans B, alors si B est vrai, n (A) / n (B) doit être supérieur à n (A) / n (S) comme B est un espace plus petit que S. Même dans le second, vous dites de même?
Rahul Deora
@RahulDeora - Oui, c'est comme ça que ça fonctionne. La version faible est beaucoup moins évidente, mais vous avez quand même déjà fait le calcul. Ce que vous avez demandé, c'est l'intuition derrière le résultat, qui peut être mieux observée dans l'énoncé le plus fort.
Rainer P.
Un petit problème avec l'utilisation de cette déclaration pour gagner en intuition est qu'elle n'est pas entièrement vraie. «A impliquant B» n'est pas une condition suffisante pour «quand B alors A est plus probable». La distinction importante est qu'avec «A impliquant B», il n'est pas nécessaire de rendre B plus probable. Les exemples les plus importants sont lorsque B est toujours vrai.
Sextus Empiricus
0

P(successful|Alice)>P(successful)P(Alice|successful)>P(Alice)

Ou supposons qu'il y ait une école qui a 10% des élèves dans son district scolaire, mais 15% des élèves de catégorie A. Ensuite, il est clair que le pourcentage d'élèves de cette école qui sont des élèves de catégorie A est supérieur au pourcentage à l'échelle du district.

P(A&B)>P(A)P(B)AB

Accumulation
la source