J'ai essayé de développer une compréhension basée sur l'intuition du théorème de Bayes en termes de probabilité antérieure , postérieure , de probabilité et marginale . Pour cela, j'utilise l'équation suivante: où représente une hypothèse ou une croyance et représente des données ou des preuves. J'ai compris le concept du postérieur - c'est une entité unificatrice qui combine la croyance antérieure et la probabilité d'un événement. Ce que je ne comprends pas, c'est ce que signifie la probabilité ? Et pourquoi le marginal AB
probabilité au dénominateur?
Après avoir examiné quelques ressources, je suis tombé sur cette citation:
La probabilité est le poids de l'événement donné par l'occurrence de ... P (B | A) est la probabilité postérieure de l'événement B , étant donné que l'événement A s'est produit.A P ( B | A )A
Les 2 déclarations ci-dessus me semblent identiques, juste écrites de différentes manières. Quelqu'un peut-il expliquer la différence entre les deux?
la source
Réponses:
Bien qu'il y ait quatre composants énumérés dans la loi de Bayes, je préfère penser en termes de trois composants conceptuels:
la source
Il existe déjà plusieurs bonnes réponses, mais cela peut peut-être ajouter quelque chose de nouveau ...
Je pense toujours à la règle de Bayes en termes de probabilités composantes, qui peuvent être comprises géométriquement en termes d'événements et comme illustré ci-dessous.BUNE B
Les probabilités marginales et sont données par les aires des cercles correspondants. Tous les résultats possibles sont représentés par , correspondant à l'ensemble des événements " ou ". La probabilité conjointe correspond à l'événement " et ".P ( B ) P ( A ∪ B ) = 1 A B P ( A ∩ B ) A BP( A ) P( B ) P( A ∪ B ) = 1 UNE B P( A ∩ B ) UNE B
Dans ce cadre, les probabilités conditionnelles du théorème de Bayes peuvent être comprises comme des rapports d'aires. La probabilité de donné est la fraction de occupée par , exprimée comme De même, la probabilité de étant donné est la fraction de occupée par , c'est-à-dire B B A ∩ B P ( A | B ) = P ( A ∩ B )UNE B B A ∩ B BAAA∩BP(B|A)=P(A∩B)
Le théorème de Bayes n'est vraiment qu'une conséquence mathématique des définitions ci-dessus, qui peuvent être reformulées comme I trouver cette forme symétrique du théorème de Bayes est beaucoup plus facile à retenir. C'est-à-dire que l'identité est valable quel que soit le ou le étiquetés "antérieurs" ou "postérieurs".p ( A ) p ( B )
(Une autre façon de comprendre la discussion ci-dessus est donnée dans ma réponse à cette question , d'un point de vue plus "tableur comptable".)
la source
@gung a une excellente réponse. J'ajouterais un exemple pour expliquer "l'initiation" dans un exemple du monde réel.
Pour une meilleure connexion avec des exemples du monde réel, je voudrais changer la notation, où utiliser pour représenter l'hypothèse (le dans votre équation), et utiliser pour représenter la preuve. (le dans votre équation.)A E BH UNE E B
La formule est donc
Notez que la même formule peut s'écrire
où signifie proportionnel à et est la vraisemblance et est l'a priori . Cette équation signifie que le postérieur sera plus grand, si le côté droit de l'équation est plus grand. Et vous pouvez penser que est une constante de normalisation pour transformer le nombre en probabilité (la raison pour laquelle je dis que c'est une constante est parce que la preuve est déjà donnée.).∝ P( E| H) P( H) P( E) E
Pour un exemple concret, supposons que nous effectuons une détection de fraude sur les transactions par carte de crédit. L'hypothèse serait alors où représenter la transaction est normale ou frauduleuse. (J'ai choisi un cas de déséquilibre extrême pour montrer l'intuition).H∈ { 0 , 1 }
D'après la connaissance du domaine, nous savons que la plupart des transactions seraient normales, seules quelques-unes sont des fraudes. Supposons qu'un expert nous ait dit qu'il y en aurait sur serait une fraude. On peut donc dire que l'a priori est , et .1 1000 P( H= 1 ) = 0,001 P( H= 0 ) = 0,999
Le but ultime est de calculer ce qui signifie que nous voulons savoir si une transaction est une fraude non fondée sur des preuves en plus des précédentes . Si vous regardez le côté droit de l'équation, nous le décomposons en vraisemblance et avant .P( H| E)
Là où nous avons déjà expliqué ce qui est antérieur , nous expliquons ici ce qu'est la vraisemblance. Supposons que nous ayons deux types de preuves, qui représentent, si nous voyons une localisation géographique normale ou étrange de la transaction.E∈ { 0 , 1 }
La probabilité peut être petite, ce qui signifie que dans le cas d'une transaction normale, il est très peu probable que l'emplacement soit étrange. En revanche, peut être grand.P( E= 1 | H= 0 ) P( E= 1 | H= 1 )
Supposons que nous ayons observé nous voulons voir s'il s'agit d'une fraude ou non, nous devons considérer à la fois la probabilité et la probabilité . Intuitivement, par le passé, nous savons qu'il y a très peu de transactions de fraude, nous serions probablement très prudents pour faire une classification de fraude, à moins que les preuves ne soient très solides. Par conséquent, le produit entre deux considérera deux facteurs en même temps.E= 1
la source
Notez que la règle de Bayes est
Notez le ratio
Si , alors . C'est presque comme si nous disions à quel point le joint s'écarte de la pleine indépendance, ou combien d'informations les variables ont en commun.B ⊥ A P( b , a ) = P( B ) P( A )
Fait intéressant, le journal de ce rapport est également présent dans les informations mutuelles:
la source
Je trouve souvent la visualisation du théorème sous forme de tableau, avec les résultats possibles pour "B" comme lignes et les résultats possibles pour "A" comme colonnes. Les probabilités conjointes sont les valeurs de chaque cellule. Dans ce tableau, nous avonsP( A , B )
vraisemblance = proportions de lignes postérieures = proportions de colonnes
L'ancien et le marginal sont définis de façon analogue, mais basés sur des «totaux» au lieu d'une colonne particulière
marginal = proportions totales de la ligne a priori = proportions totales de la colonne
Je trouve que cela m'aide.
la source