Les bayésiens acceptent-ils les axiomes de Kolmogorov?

24

Habituellement, la théorie des probabilités est enseignée avec les axiomes de Kolgomorov. Les bayésiens acceptent-ils également les axiomes de Kolmogorov?

Manuscrit
la source
8
La théorie bayésienne découle des axiomes standard de probabilité, donc des axiomes de Kolmogorov.
Xi'an
3
@ Xi'an: Que les degrés subjectifs de croyance peuvent être représentés par la probabilité n'est pas si évident - d'où la question, et le travail de Ramsey & de Finetti.
Scortchi - Réintégrer Monica
2
C'est pourquoi je suis un bayésien "objectif" et je commence par des distributions antérieures définies selon les normes de la théorie des probabilités ...
Xi'an
2
Je crois que l'interprétation de la probabilité par Cox-Jaynes fournit une base rigoureuse pour la probabilité bayésienne. (voir ma réponse). Cependant, ce serait bien d'avoir l'avis de Xi'an à ce sujet.
Sommet du
1
@Summit: merci mais j'ai bien peur de ne pas être très intéressé par la question ...!
Xi'an

Réponses:

25

À mon avis, l'interprétation de la probabilité par Cox-Jaynes fournit une base rigoureuse pour la probabilité bayésienne:

  • Cox, Richard T. "Probabilité, fréquence et attente raisonnable." Journal américain de physique 14.1 (1946): 1-13.
  • Jaynes, Edwin T. Théorie des probabilités: la logique de la science. Cambridge University Press, 2003.
  • Beck, James L. "Identification du système bayésien basé sur la logique des probabilités." Contrôle structurel et surveillance de la santé 17.7 (2010): 825-847.

Les axiomes de la logique de probabilité dérivée par Cox sont:

  1. (P1): (par convention)Pr[b|une]0
  2. (P2): (fonction de négation)Pr[b¯|une]=1-Pr[b|une]
  3. (P3): (fonction de conjonction)Pr[bc|une]=Pr[c|bune]Pr[b|une]

Les axiomes P1-P3 impliquent ce qui suit (Beck, James L. "Identification du système bayésien basé sur la logique des probabilités." Contrôle structurel et surveillance de la santé 17.7 (2010): 825-847):

  1. (P4): a) ; b) ; c)Pr [ ¯ b | b c ] = 0 Pr [ b | c ] [ 0 , 1 ]Pr[b|bc]=1Pr[b¯|bc]=0Pr[b|c][0,1]
  2. (P5): a) , b) , où signifie que est contenu dans , et signifie que est équivalent à .Pr [ a | c ( a b ) ] = Pr [ b | c ( a b ) ] a b a c a b a bPr[a|c(ab)]Pr[b|c(ab)]Pr[a|c(ab)]=Pr[b|c(ab)]abacunebuneb
  3. (P6):Pr[uneb|c]=Pr[une|c]+Pr[b|c]-Pr[uneb|c]
  4. (P7): En supposant que la proposition indique qu'une et une seule des propositions est vraie, alors: b 1 , , b Ncb1,,bN
    • a) Théorème de marginalisation:Pr[une|c]=n=1NP[unebn|c]
    • b) Théorème de probabilité totale:Pr[une|c]=n=1NPr[une|bnc]Pr[bn|c]
    • c) Théorème de Bayes: Pour :Pr [ b k | a c ] = Pr [ a | b kc ] Pr [ b k | c ]k=1,,NPr[bk|unec]=Pr[une|bkc]Pr[bk|c]n=1NPr[une|bnc]Pr[bn|c]

Ils impliquent la déclaration de logique de Kolmogorov, qui peut être considérée comme un cas spécial.

Dans mon interprétation d'un point de vue bayésien, tout est toujours (implicitement) conditionné à nos croyances et à nos connaissances.

La comparaison suivante est tirée de Beck (2010): Identification du système bayésien basée sur la logique des probabilités

Le point de vue bayésien

La probabilité est une mesure de plausibilité d'une déclaration basée sur des informations spécifiées.

  1. Les distributions de probabilité représentent des états de connaissances plausibles sur les systèmes et les phénomènes, et non leurs propriétés inhérentes.
  2. La probabilité d'un modèle est une mesure de sa plausibilité par rapport aux autres modèles d'un ensemble.
  3. Quantifie de façon pragmatique l'incertitude due aux informations manquantes sans prétendre que cela est dû au caractère aléatoire inhérent à la nature.

Le point de vue fréquentiste

La probabilité est la fréquence relative d'occurrence d'un événement intrinsèquement aléatoire à long terme .

  1. Les distributions de probabilité sont des propriétés inhérentes aux phénomènes aléatoires.
  2. Portée limitée, par exemple aucune signification pour la probabilité d'un modèle.
  3. Le caractère aléatoire inhérent est supposé, mais ne peut pas être prouvé.

Comment dériver les axiomes de Kolmogorov des axiomes ci-dessus

Dans ce qui suit, la section 2.2 de [Beck, James L. "Identification du système bayésien basé sur la logique des probabilités." Contrôle structurel et surveillance de la santé 17.7 (2010): 825-847.] Est résumé:

Dans ce qui suit, nous utilisons: mesure de probabilité sur le sous-ensemble d'un ensemble fini :A XPr(A)AX

  1. [K1]:Pr(A)0,AX
  2. [K2]:Pr(X)=1
  3. [K3]: if and are disjoint.A BPr(AB)=Pr(A)+Pr(B),A,BXAB

Afin de dériver (K1-K3) des axiomes de la théorie des probabilités, [Beck, 2010] a introduit la proposition qui énonce et spécifie le modèle de probabilité pour . [Beck, 2010] introduit en outre .x X x Pr ( A ) = Pr [ x A | π ]πxXxPr(A)=Pr[xA|π]

  • P1 implique K1 avec etc = πb={xA}c=π
  • K2 découle de ; P4 (a), et stipule que .π x XPr[xX|π]=1πxX
  • K3 peut être dérivé de P6: et sont disjoints signifie que et s'excluent mutuellement. Par conséquent, K3:ABXUNEXB Pr(XUNEB|π)=Pr(XUNE|π)+Pr(XB|π)
Sommet
la source
5
Depuis votre K3, vous pouvez accéder à (additivité finie) mais pas au 3e axiome de Kolmogorov, (additivité dénombrable) lorsque les sont des éléments d'un champ , et pas simplement des sous-ensembles d'un ensemble fini. Pr(je=1nUNEje)=je=1nPr(UNEje)Pr(je=1UNEje)=je=1Pr(UNEje)UNEσ
Scortchi - Réintégrer Monica
2
@Scortchi KRKoch dans son introduction aux statistiques bayésiennes cite Bernardo et Smith (1994), Bayesian Theory, p. 105, comme une source qui montre comment adresser l'infini dénombrable. Je ne l'ai pas vérifié, mais comme référence, il peut tout aussi bien être donné ici.
gwr
12

Après le développement de la théorie des probabilités, il a été nécessaire de montrer que des concepts plus souples répondant au nom de "probabilité" se mesuraient au concept rigoureusement défini qu'ils avaient inspiré. Les probabilités bayésiennes "subjectives" ont été examinées par Ramsey et de Finetti, qui ont montré indépendamment qu'une quantification du degré de croyance soumis aux contraintes de comparabilité et de cohérence (vos croyances sont cohérentes si personne ne peut faire un livre néerlandais contre vous) doit être une probabilité.

Les différences entre les axiomatisations sont en grande partie une question de goût concernant ce qui devrait être ce qui est défini et ce qui en dérive. Mais l'additivité dénombrable est l'une de celles de Kolmogorov qui ne peut pas être dérivée de celle de Cox ou de Finetti, et a été controversée. Certains bayésiens (par exemple de Finetti et Savage) s'arrêtent à une additivité finie et n'acceptent donc pas tous les axiomes de Kolmogorov. Ils peuvent mettre des distributions de probabilité uniformes sur des intervalles infinis sans irrégularité. D'autres suivent Villegas en assumant également la continuité monotone, et en tirent une additivité dénombrable.

Ramsey (1926), "Vérité et probabilité", dans Ramsey (1931), Les fondements des mathématiques et autres essais logiques

de Finetti (1931), "Sul significato soggettivo della probabilità", Fundamenta Mathematicæ , 17 , pp 298 - 329

Villegas (1964), "Sur la probabilité qualitative algèbres", Ann. Math. Statist. , 35 , 4.σ

Scortchi - Réintégrer Monica
la source
3
Pourquoi ma réponse ne devrait-elle traiter que des probabilités «objectives bayésiennes»? Le travail fondateur de Cox (1946) aborde explicitement la question de la subjectivité! C'est un document très intéressant - et facile à lire. Je ne pense pas qu'il soit logique de distinguer entre les probabilités bayésiennes «subjectives» et «objectives»: tout est toujours implicitement conditionné à la personne effectuant l'analyse -> et à cet égard «subjectif».
Sommet du
concernant la dérivation des axiomes, a déclaré Kolmogorov à partir de Cox: Je suis satisfait de la façon dont cela se fait dans la section 2.2 de Beck, James L. «Identification du système bayésien basée sur la logique des probabilités». Contrôle structurel et surveillance de la santé 17.7 (2010): 825-847.
Sommet du
1
@Summit: (1) Vous avez raison; c'est plutôt que la vision dispositionnelle de la probabilité de Ramsey & de Finetti les place carrément dans le camp "subjectif", alors que celle de Cox est plus généralement applicable. (2) Voulez-vous dire que l'additivité dénombrable peut être déduite des postulats de Cox?
Scortchi - Réintégrer Monica
J'ai étendu ma réponse et j'attends vos commentaires avec impatience.
Sommet du
1
@Summit: Merci - j'espère trouver le temps de rendre le mien encore à moitié aussi approfondi. J'ai souligné l'écart entre l'endroit où vous pouvez vous rendre du théorème de Cox et les axiomes de Kolmogorov "complets" et je pense que cela est particulièrement pertinent pour la question (même si je l'avais complètement oublié lorsque j'ai répondu pour la première fois). Jaynes avait des choses intéressantes à dire sur ce BTW.
Scortchi - Réintégrer Monica