Pourquoi «expliquer» a-t-il un sens intuitif?

36

J'ai récemment appris l'existence d'un principe de raisonnement probabiliste appelé " expliquer ", et j'essaie d'en saisir l'intuition.

Permettez-moi de mettre en place un scénario. Soit A l’événement d’un séisme. Que l’événement B soit l’événement où le joyeux géant vert se promène en ville. Soit C l’événement où le sol tremble. Let AB . Comme vousvoyez,soitA ouB peut provoquerC .

J'utilise le raisonnement "expliquer loin", si C se produit, l'un de P(A) ou P(B) augmente, mais l'autre diminue, car je n'ai pas besoin de raisons alternatives pour expliquer pourquoi C s'est produit. Cependant, mon intuition actuelle me dit que P(A) et P(B) devraient tous les deux augmenter si C survient, car la survenue de C accroît la probabilité que l'une des causes de C produise.

Comment concilier mon intuition actuelle avec l'idée d'expliquer? Comment utiliser l'explication pour justifier que A et B dépendent conditionnellement de C ?

David Faux
la source
4
Qu'est-ce que signifie? AB
Mark999
2
Cela signifie que est indépendant de BAB , désolé.
David Faux
1
Je choisirais un scénario moins susceptible de vous embrouiller. "Secouer le sol" pourrait être la cause ou l'effet du "tremblement de terre", et les deux sont probablement causés par le "géant vert qui se promène". Pour expliquer que cela se produise, A et B doivent tous deux être des causes de C.
Neil G
@ DavidFaux vous n'avez pas besoin de vous excuser. C'est la notation mathématique standard pour affirmer l'indépendance des variables. Au fait, bravo à la bonne question et aussi +1 parce que le lien que vous fournissez est vraiment très bon! J'avais été dérouté par tous ces concepts et l'article que vous avez fourni est vraiment bon. Merci! :)
Charlie Parker

Réponses:

39

Clarification et notation

si C se produit, l'un de P (A) ou P (B) augmente, mais l'autre diminue

Ce n'est pas correct Vous avez (implicitement et raisonnablement) supposé que A est (marginalement) indépendant de B et également que A et B sont les seules causes de C. Cela implique que A et B sont effectivement dépendants de C , leur effet conjoint. Ces faits sont cohérents parce que l'explication est à propos de P (A | C), qui n'est pas la même distribution que P (A). La notation de la barre de conditionnement est importante ici.

Cependant, mon intuition actuelle me dit que P (A) et P (B) devraient tous les deux augmenter si C survient, car la survenue de C accroît la probabilité que l'une des causes de C se produise.

Vous avez «l'inférence d'une démolition semi-contrôlée» (voir ci-dessous pour plus de détails). Pour commencer, vous pensez déjà que C indique que soit A ou B est arrivé que vous ne pouvez plus être certain que ce soit A ou B qui est arrivé quand vous voyez C. Mais que dire de A et B étant donné C? Eh bien, cela est possible, mais moins probable que ce soit A et non B ou B et non A. C’est la "explication" et ce que vous voulez de l’intuition.

Intuition

Passons à un modèle continu afin de pouvoir visualiser les choses plus facilement et de penser à la corrélation comme une forme particulière de non-indépendance. Supposons que les notes en lecture (A) et en mathématiques (B) sont distribuées indépendamment dans la population en général. Supposons maintenant qu’une école admettra (C) un élève avec un score combiné en lecture et en mathématiques dépassant un certain seuil. (Peu importe ce seuil, tant qu'il est au moins un peu sélectif).

Voici un exemple concret: Supposons que l’unité indépendante distribue normalement les scores en lecture et en mathématiques et un échantillon d’élèves, résumés ci-dessous. Lorsque les résultats en lecture et en mathématiques d'un élève dépassent le seuil d'admission (ici 1,5), l'étudiant est représenté par un point rouge.

expliquer comme une relation de collisionneur

Etant donné que les bonnes notes en mathématiques compensent les mauvaises notes en lecture et vice-versa, la population d'élèves admis sera telle que la lecture et les mathématiques sont désormais liées et négativement corrélées (-0,65 ici). Ceci est également vrai dans la population non admise (-0,19 ici).

Ainsi, lorsque vous rencontrez une élève choisie au hasard et que vous entendez parler de son score élevé en mathématiques, vous devez alors vous attendre à ce qu'elle obtienne un score en lecture inférieur - le score en mathématiques explique son admission. Bien sûr, elle pourrait aussi avoir un score élevé en lecture - cela se produit certainement dans l'intrigue - mais c'est moins probable. Et rien de tout cela n’affecte notre hypothèse antérieure de l’absence de corrélation, positive ou négative, entre les résultats en mathématiques et en lecture dans la population générale.

Contrôle de l'intuition

Revenons à un exemple discret plus proche de votre original. Considérez le meilleur (et peut-être le seul) dessin animé sur «expliquer plus loin».

démolition semi-contrôlée

Le complot du gouvernement est A, le complot terroriste est B, et traitez la destruction générale comme un C, ignorant le fait qu'il y a deux tours. S'il est clair pourquoi le public est tout à fait rationnel lorsqu'il doute de la théorie de l'orateur, vous comprenez alors qu'il faut expliquer.

conjuguéprior
la source
3
Je pense que les exemples sont des plus regrettables. Même si les mathématiques et la capacité de lecture sont supposées être considérées comme indépendantes, ce n’est probablement pas le cas, ce qui entraîne une certaine confusion quant à l’utilisation ultérieure du terme "fait".
Robert Jones
Je pense qu'un meilleur exemple serait le cas d'une personne qui aurait pu manger une livre de quelque chose qui aurait pu être des pommes de terre ou des saucisses. Si cette personne n'avait pas pris de poids pendant la période de l'expérience, la probabilité d'avoir consommé des pommes de terre ou des saucisses serait alors moindre que si elle avait pris du poids.
Robert Jones
De toute évidence, cette personne aurait plutôt pu manger quelque chose d’autre et il aurait peut-être également fallu se préoccuper davantage des toilettes, il était donc nécessaire d’être prêt à chercher ailleurs des explications.
Robert Jones
@RobertJones, l'exemple qui m'a été donné en classe était "cérébral" et "sportif" comme critère d'admission.
Gwg
1
Si je comprends bien, la santé mentale et physique sont généralement considérées comme corrélées.
Robert Jones
26

Je pense que votre intuition est ok mais votre compréhension du raisonnement "expliquer" est fausse.

Dans l'article que vous avez lié à

"Expliquer" est un schéma de raisonnement courant dans lequel la confirmation d'une cause d'un événement observé ou présumé réduit la nécessité d'invoquer des causes alternatives.

(emphase ajoutée)

C'est assez différent de votre:

J'utilise le raisonnement "expliquer loin", si se produit, l'un de P ( A ) ou P ( B ) augmente, mais l'autre diminue, car je n'ai pas besoin de raisons alternatives pour expliquer pourquoi C s'est produit.CP(A)P(B)C

Vous n'avez pas seulement besoin de pour qu'il se produise, il doit aussi avoir été expliqué par la confirmation de A ou de BCAB avant de réduire la probabilité d'une autre explication possible.

BCCP(A|C)P(B|C)P(A)P(B) respectivement, selon la réponse de @Glen_b.

Peter Ellis
la source
+1 pour quelques autres réponses mais je ne pense pas que l'accent soit mis sur ce que je pense, c'est que le PO a mal interprété "expliquer".
Peter Ellis
+1: Concis et précis. Vous voudrez peut-être aussi indiquer que OP peut aussi manquer, mais que A et B doivent être les causes de C.
Neil G
5

AB

P(A|C)=P(C|A)P(A)P(C)P(B|C)

P(C|A)P(C)P(C|B)P(C) ABC n'a été observée.

C

P(A|C)P(B|C)=P(C|A)P(A)P(C|B)P(B)

CP(A)/P(B)C

Glen_b -Reinstate Monica
la source
2

Vous demandez de l'intuition. Qu'est-ce que ça veut direUNE et B are independent? It means that if I tell you that I've just seen the monster, your opinion about the occurrence or not of the earthquake doesn't change; and conversely. If you think that both P(CA) and P(CB) are high, and I tell you that the ground is shaking and there is no monster in the town, wouldn't that change your opinion about the occurrence of the earthquake, making it more probable?

Zen
la source
2

From the linked abstract, it appears that "explaining away" is discussing a learning mechanism, a common way that humans reason, not a formal method of logic or probability. It's a human-like way of reasoning that's not formally correct, just as inductive reasoning is not formally correct (as opposed to deductive reasoning). So I think the formal logic and probability answers are very good, but not applicable. (Note that the abstract is in a Machine Intelligence context.)

Votre exemple de géant est très bon pour cela. Nous croyons que les tremblements de terre ou les géants peuvent faire trembler le sol. Mais nous pensons également que les géants n’existent pas ou qu’il est extrêmement improbable qu’ils existent. Le sol tremble. Nous ne rechercherons pas si un géant se promène, mais nous nous demanderons plutôt si un tremblement de terre s’est produit. En apprenant qu'un tremblement de terre a bien eu lieu, nous sommes encore plus convaincus que les tremblements de terre sont une explication adéquate du terrain tremblant et que les géants sont encore plus certains de ne pas exister ou du moins encore moins susceptibles d'exister.

Nous accepterions seulement qu’un géant fasse trembler le sol seulement si: 1) nous avons réellement assisté au témoin et sommes disposés à croire que nous ne sommes pas dupes et que notre hypothèse précédente selon laquelle les géants étaient hautement improbables ou impossibles était fausse, ou 2) nous pourrions totalement éliminer la possibilité d’un tremblement de terre et éliminer toutes les possibilités D, E, F, G,… auxquelles nous n’avions pas pensé auparavant mais qui semblent plus probables qu’un géant.

Dans le cas des géants, cela a du sens. Ce mécanisme d'apprentissage (une explication que nous jugeons probable le devient encore plus probable et fait en sorte que d'autres explications deviennent moins probables chaque fois que cette explication fonctionne) est raisonnable en général, mais nous brûlera aussi. Par exemple, les idées selon lesquelles la Terre gravite autour du Soleil ou que les ulcères sont causés par des bactéries ont du mal à gagner du terrain à cause de "l'explication", ce que nous appellerions dans ce cas un biais de confirmation.

The fact that the abstract is in a Machine Intelligence setting also makes me thing this is discussing a learning mechanism commonly used by humans (and other animals, I imagine) that could benefit learning systems even though it can also be highly flawed. The AI community tried formal systems for years without getting closer to human-like intelligence and I believe that pragmatics has won out over formalism and "explaining away" is something that we do and thus that AI needs to do.

Wayne
la source
1

I think an easier way to think of it is: If there is any variable C (0<P(C)<1) such that the occurrence of C increases the probability of both A and B, then A and B cannot be independent. In your example, you actually chose variables that you intuitively understand to be dependent, not independent. That is, the event that there is an earthquake and a giant stomping around aren't independent, since they both are more likely to occur when the floor is shaking. Here is another example: Let C be the event that it rains, and A be the event that you use an umbrella, and B the event that you wear rainboots. Clearly A and B are not independent because when C occurs, you are more likely to both wear galoshes and carry and umbrella. But if you lived in an area that never, ever rained, then A and B could potentially be independent--neither the umbrella nor galoshes are being used as rain gear, so perhaps you wear the galoshes in the garden and use the umbrella to catch fish. They are only able to be independent because they don't share a cause.

Here is a proof: Suppose A and B are independent and also conditionally independent given C.

  1. P(AB)=P(A)P(B)=P(A|C)P(B|C)P(C)2 since A is independent of B
  2. P(AB)=P(AB|C)P(C)=P(A|C)P(B|C)P(C) since A is cond. independent of B given C.

It follows from 1 and 2 that P(C)=P(C)2 hence P(C)=0 or P(C)=1.

guest47
la source
I think the OP is wondering how to understand A and B being marginally independent but dependent conditional on C, not how to understand A and B being marginally dependent but independent conditional on C.
conjugateprior