Pourquoi avons-nous besoin de sigma-algèbres pour définir des espaces de probabilité?

122

Nous avons une expérience aléatoire avec différents résultats formant l’ espace échantillon Ω, sur lesquels nous examinons avec intérêt certains modèles appelés événements Les sigma-algèbres (ou sigma-champs) sont constitués d'événements auxquels une mesure de probabilité peut être affectée. Certaines propriétés sont remplies, notamment l'inclusion de l'ensemble null et de l'espace d'échantillonnage complet, ainsi qu'une algèbre décrivant les unions et les intersections avec les diagrammes de Venn.F. P

La probabilité est définie comme une fonction entre algebra et l'intervalle . Au total, le triple forme un espace de probabilité .σ[0,1](Ω,F,P)

Quelqu'un pourrait-il expliquer en termes simples pourquoi la probabilité que l'édifice s'écroule si nous n'avions pas un algèbre? Ils sont juste coincés au milieu avec ce "F" calligraphique impossible. J'espère qu'ils sont nécessaires. Je vois qu'un événement est différent d'un résultat, mais que se passerait-il sans un algebras?σσ

La question qui se pose est la suivante: dans quel type de problèmes de probabilité la définition d’un espace de probabilité comprenant un algèbre devient une nécessité?σ


Ce document en ligne sur le site Web de l’Université de Dartmouth fournit une explication simple en anglais accessible. L'idée est un pointeur en rotation tournant dans le sens contraire des aiguilles d'une montre sur un cercle de périmètre unitaire :

entrez la description de l'image ici

Nous commençons par construire un cône qui se compose d’un cercle d’unités de circonférence et d’un pointeur, comme indiqué sur la figure. Nous choisissons un point sur le cercle et l’appelons , puis tous les autres points du cercle avec la distance, disons , de à ce point, mesurée dans le sens inverse des aiguilles d’une montre. L'expérience consiste à faire tourner le pointeur et à enregistrer l'étiquette du point situé à l'extrémité du pointeur. Laissons la variable aléatoire indiquer la valeur de ce résultat. L’espace échantillon correspond clairement à l’intervalle [ 0 , 1 )0X0X[0,1). Nous aimerions construire un modèle de probabilité dans lequel chaque résultat est également susceptible de se produire. Si nous procédons comme nous l'avons fait pour [...] des expériences avec un nombre fini de résultats possibles, nous devons alors attribuer la probabilité 0 à chaque résultat, car sinon la somme des probabilités, sur tous les résultats possibles, ne serait pas égal 1. (En fait, additionner un nombre indénombrable de nombres réels est une tâche délicate; en particulier, pour qu'une telle somme ait un sens, il est tout au plus possible de nommer de nombreux sommands différents de 0 ) Toutefois, si toutes les probabilités attribuées sont 0 , alors la somme est 0 , pas 1 , comme il se doit.

Donc, si nous attribuons une probabilité à chaque point, et compte tenu du nombre infini (indénombrable) de points, leur somme totaliserait >1 .

Antoni Parellada
la source
9
Il semble illusoire de demander des réponses sur les champs qui ne mentionnent pas la théorie de la mesure! σ
Xi'an
5
Je l'ai fait cependant ... Je ne suis pas sûr de comprendre votre commentaire.
Antoni Parellada
8
Certes, le besoin de champs sigma n’est pas seulement une question d’opinion ... Je pense que cela peut être envisagé ici (à mon avis).
gung
8
Si votre besoin de théorie des probabilités se limite aux "têtes" et aux "queues", il est clair qu'il n'y a pas besoin de champs ! σ
Xi'an
26
Je pense que c'est une bonne question. On voit souvent dans les manuels scolaires des références totalement superflues à des triples de probabilité que l’auteur ignore ensuite par la suite. (Ω,F,P)
dsaxton

Réponses:

124

Premier point de Xi'an: lorsque vous parlez d’ algèbres- , vous parlez d’ensembles mesurables. Par conséquent, toute réponse doit malheureusement se concentrer sur la théorie des mesures. Je vais essayer de construire à cela doucement, cependant.σ

Une théorie des probabilités admettant tous les sous-ensembles d'ensembles indénombrables rompra les mathématiques

Considérez cet exemple. Supposons que vous avez une unité carrée dans et que la probabilité de sélectionner au hasard un point membre d'un ensemble spécifique dans l'unité carrée vous intéresse. Dans de nombreuses circonstances, il est facile de répondre à cette question en comparant les zones des différents ensembles. Par exemple, nous pouvons dessiner des cercles, mesurer leurs aires, puis prendre la probabilité comme fraction du carré tombant dans le cercle. Très simple.R2

Mais que se passe-t-il si la zone de l'ensemble d'intérêt n'est pas bien définie?

Si la zone n'est pas bien définie, nous pouvons alors raisonner en deux conclusions différentes mais tout à fait valables (dans un certain sens) sur la nature de la zone. On pourrait donc avoir d'une part et P ( A ) = 0 d'autre part, ce qui implique 0 = 1 . Cela casse toutes les maths au-delà de la réparation. Vous pouvez maintenant prouver 5 < 0 et un certain nombre d'autres choses absurdes. Clairement, ce n'est pas trop utile.P(UNE)=1P(UNE)=00=15<0

-algebras sont le patch qui corrige les mathsσ

Qu'est-ce qu'une algèbre , précisément? Ce n'est en fait pas si effrayant. C'est juste une définition des ensembles qui peuvent être considérés comme des événements. Les éléments non en F n'ont simplement aucune mesure de probabilité définie. Fondamentalement, les σ -algèbres sont le "patch" qui nous permet d'éviter certains comportements pathologiques des mathématiques, à savoir les ensembles non mesurables.σFσ

Les trois exigences d'un champ peuvent être considérées comme les conséquences de ce que nous aimerions faire avec la probabilité: un champ σ est un ensemble qui possède trois propriétés:σσ

  1. Fermeture sous des syndicats dénombrables.
  2. Fermeture sous des intersections dénombrables.
  3. Fermeture sous compléments.

Les composantes des unions et des intersections dénombrables sont des conséquences directes de la question d'ensemble non mesurable. Fermeture sous compléments est une conséquence des axiomes de Kolmogorov: si , P ( A c ) doit être 1 / 3 . Mais sans (3), il pourrait arriver que P ( A c ) ne soit pas défini. Ce serait étrange. La fermeture sous complément et les axiomes de Kolmogorov nous permettent de dire des choses comme P ( A A c ) = P (P(UNE)=2/3P(UNEc)1/3P(UNEc) .P(UNEUNEc)=P(UNE)+1-P(UNE)=1

Enfin, nous envisageons des événements par rapport à , donc nous avons besoin de plus que Ω FΩΩF

Bonne nouvelle: les algèbres ne sont strictement nécessaires que pour des ensembles indénombrablesσ

Mais! Il y a de bonnes nouvelles ici, aussi. Ou, au moins, une façon de contourner le problème. Nous n'avons besoin de -algebras que si nous travaillons dans un ensemble avec une cardinalité indénombrable. Si nous nous limitons aux ensembles dénombrables, nous pouvons alors prendre F = 2 Ω l’ensemble de puissances de Ω et nous n’aurons aucun de ces problèmes car pour Ω dénombrable , 2 Ω se compose uniquement d’ensembles mesurables. (Cela est mentionné dans le deuxième commentaire de Xi'an.) Vous remarquerez que certains manuels vont réellement commettre un tour de passe-passe subtil ici, et ne considérer que des ensembles dénombrables lors de la discussion d'espaces de probabilité.σF=2ΩΩΩ2Ω

De plus, dans les problèmes géométriques de , il est parfaitement suffisant de ne considérer que les σ -algèbres composées d'ensembles pour lesquels la mesure L n est définie. Pour fonder cela un peu plus fermement, L n pour n = 1 , 2 , 3 correspond aux notions habituelles de longueur, surface et volume. Donc, ce que je dis dans l'exemple précédent, c'est que l'ensemble doit avoir une zone bien définie pour pouvoir se voir attribuer une probabilité géométrique. Et la raison est la suivante: si nous admettons des ensembles non mesurables, nous pouvons alors nous retrouver dans des situations où nous pouvons affecter la probabilité 1 à un événement sur la base de certaines preuves, et la probabilité 0 àRnσLnLnn=1,2,3le même événement événement basé sur une autre preuve.

Mais ne laissez pas la connexion à des ensembles indénombrables vous confondre! Une idée fausse commune selon laquelle les -algèbres sont des ensembles dénombrables. En fait, ils peuvent être dénombrables ou non. Considérez cette illustration: comme précédemment, nous avons un carré unité. Définir F = Tous les sous-ensembles du carré unitaire avec une  mesure définie de  L 2 . Vous pouvez dessiner un carré B avec une longueur de côté s pour tout s ( 0 , 1 ) et avec un coin à ( 0 , 0 )σ

F=Tous les sous-ensembles de l’unité carrée avec défini L2 mesure.
Bss(0,1)(0,0). Il devrait être clair que ce carré est un sous-ensemble du carré unitaire. De plus, l' ensemble de ces carrés ont zone définie, de sorte que ces carrés sont des éléments de . Mais il devrait également être clair qu'il existe un nombre incalculable de carrés B : le nombre de tels carrés est indénombrable, et chaque carré a défini la mesure de Lebesgue.FB

Donc, sur le plan pratique, il suffit souvent de faire cette observation pour constater que vous ne tenez compte que des ensembles mesurables de Lebesgue pour progresser contre le problème de l’intérêt.

Mais attendez, qu'est-ce qu'un ensemble non mesurable?

J'ai bien peur de ne pouvoir éclaircir un peu cette question moi-même. Mais le paradoxe de Banach-Tarski (parfois le paradoxe du "soleil et pois") peut nous aider:

Dans le cas d'une balle solide dans un espace tridimensionnel, il existe une décomposition de la balle en un nombre fini de sous-ensembles disjoints, qui peuvent ensuite être rassemblés d'une manière différente pour donner deux copies identiques de la balle d'origine. En effet, le processus de réassemblage consiste uniquement à déplacer les pièces et à les faire pivoter, sans changer leur forme. Cependant, les pièces elles-mêmes ne sont pas des "solides" au sens habituel du terme, mais une dispersion infinie de points. La reconstruction peut fonctionner avec seulement cinq pièces.

Une forme plus forte du théorème implique que, si deux objets solides "raisonnables" (tels qu'une petite balle et une énorme balle) sont réunis, l'un ou l'autre peut être réassemblé dans l'autre. Ceci est souvent déclaré de manière informelle comme "un pois pouvant être haché et réassemblé dans le Soleil" et appelé le "paradoxe du pois et du soleil". 1

Ainsi, si vous utilisez des probabilités dans et que vous utilisez la mesure de probabilité géométrique (le rapport des volumes), vous souhaitez calculer la probabilité d'un événement. Mais vous aurez du mal à définir cette probabilité avec précision, car vous pouvez réorganiser les ensembles de votre espace pour modifier les volumes! Si la probabilité dépend du volume et que vous pouvez modifier le volume de l'ensemble pour qu'il corresponde à la taille du soleil ou à la taille d'un pois, la probabilité change également. Aucun événement ne sera donc attribué à une seule probabilité. Pire encore, vous pouvez réorganiser S Ω tel que le volume de S a V ( S ) > V ( Ω )R3SΩSV(S)>V(Ω), ce qui implique que la mesure de probabilité géométrique indique une probabilité , en violation flagrante des axiomes de Kolmogorov qui exigent que la probabilité ait la mesure 1.P(S)>1

Pour résoudre ce paradoxe, on pourrait faire l'une des quatre concessions suivantes:

  1. Le volume d'un ensemble peut changer lorsqu'il est pivoté.
  2. Le volume de l'union de deux ensembles disjoints peut être différent de la somme de leurs volumes.
  3. Les axiomes de la théorie des ensembles de Zermelo – Fraenkel avec l'axiome de choix (ZFC) pourraient devoir être modifiés.
  4. Certains ensembles peuvent être étiquetés "non mesurables", et il faudrait vérifier si un ensemble est "mesurable" avant de parler de son volume.

Option (1) n'aide pas à utiliser la définition des probabilités. L'option (2) viole le deuxième axiome de Kolmogorov, elle est donc désactivée. L'option (3) semble être une idée terrible car ZFC corrige beaucoup plus de problèmes qu'il n'en crée. Mais l'option (4) semble attrayante: si nous développons une théorie de ce qui est ou non mesurable, nous aurons alors des probabilités bien définies dans ce problème! Cela nous ramène à la théorie de la mesure et à notre ami l’ algèbre .σ

Sycorax
la source
5
Merci pour votre réponse. signifie Lebesque mesurable? J'aurais +1 votre réponse sur la foi, mais je l'apprécierais vraiment si vous pouviez réduire le niveau de calcul de plusieurs crans ... :-)L
Antoni Parellada
7
(+1) Bons points! J'ajouterais également que sans mesure ni algèbres , le conditionnement et la dérivation de distributions conditionnelles sur des espaces innombrables deviennent assez poilus, comme le montre le paradoxe de Borel-Kolmogorov . σ
Xi'an
2
@ Xi'an Merci pour vos gentils mots! Cela signifie vraiment beaucoup, venant de vous. Je ne connaissais pas le paradoxe de Borel-Kolmogorov au moment de la rédaction de cet article, mais je vais faire quelques lectures et voir si je parviens à compléter utilement mes découvertes.
Sycorax
3
@ Student001: Je pense que nous coupons les cheveux en quatre ici. Vous avez raison de dire que la définition générale de «mesure» (toute mesure) est donnée en utilisant le concept de sigma-algèbre. Mon point de vue, cependant, est qu'il n'y a aucun mot ou concept de "sigma-algèbre" dans la définition de la mesure de Lebesgue fournie dans mon premier lien. En d’autres termes, on peut définir la mesure de Lebesgue selon mon premier lien, mais il faut ensuite montrer que c’est une mesure et que c’est la partie la plus difficile. Je conviens que nous devrions toutefois arrêter cette discussion.
amibe
3
J'ai vraiment aimé lire votre réponse. Je ne sais pas comment vous remercier, mais vous avez beaucoup clarifié les choses! Je n'ai jamais étudié la véritable analyse, ni eu une introduction adéquate aux mathématiques. C’est un milieu de génie électrique qui s’est beaucoup concentré sur la mise en œuvre pratique Vous avez écrit cela en des termes si simples qu'un gars comme moi pourrait le comprendre. J'apprécie vraiment votre réponse et la simplicité que vous avez fournie. Merci également à @ Xi'an pour ses commentaires bien remplis!
Zushauque le
19

[0,18),[18,25),[25,34),(Ω,F)F[18,25)[20,30)[20,30)F

(Ω,F)F:F-1(1)FF

FFUNEBUNEBUNEB. Maintenant, exiger la fermeture pour les intersections et les unions dénombrables nous permet d’interroger des conjonctions ou des disjonctions dénombrables. Et nier une question est représenté par l'ensemble complémentaire. Cela nous donne une sigma-algèbre.

J'ai d'abord vu ce genre d'introduction dans le très bon livre de Peter Whittle "Probability via expectation" (Springer).

MODIFIER

jejeσσnσnσ

Mais avons-nous vraiment besoin de la loi forte des grands nombres? Selon une réponse ici , peut-être pas.

nn

σ

kjetil b halvorsen
la source
4
σP(A)[20,30)P(A)[20,30)P(A)[18,34)Bien défini, il n’est donc même pas clair que cet exemple illustre ce que vous souhaitez.
Sycorax
5
σσ
2
σ
3
Je pense que votre argument est valable. J'ai été un peu surpris à la fin, cependant, quand j'ai rencontré cette affirmation: "exiger la fermeture pour des intersections et des unions dénombrables nous permet de demander des conjonctions ou des disjonctions dénombrables". Cela semble aller au cœur du problème: pourquoi voudrait-on construire un événement d'une complexité infinie? Une bonne réponse à cela rendrait le reste de votre message plus convaincant.
whuber
2
Utilisations pratiques: la théorie des probabilités et des mesures utilisée dans les mathématiques financières (y compris les équations différentielles stochastiques, les intégrales de Ito, les filtrations d’algèbres, etc.) donne à penser qu’elle serait impossible sans les algèbres de sigma. (Je ne peux pas voter les modifications parce que j'ai déjà voté sur votre réponse!)
whuber
2

σ

σAB(AB)C

Le premier axiome est que, 𝑋∈𝜎. Eh bien, vous connaissez TOUJOURS la probabilité que rien ne se passe (0) ou que quelque chose ne se passe (1).

Le deuxième axiome est fermé sous compléments. Laissez-moi vous donner un exemple stupide. Encore une fois, considérons une pièce de monnaie avec 𝑋 = {𝐻, 𝑇}. Faites comme si je vous disais que l'algèbre de cette bascule est {∅, 𝑋, {𝐻}}. C’est-à-dire que je connais la probabilité de RIEN, de quelque chose et de la tête, mais je ne connais PAS la probabilité d’une queue. Vous m'appelleriez à juste titre un crétin. Parce que si vous connaissez la probabilité d'une tête, vous connaissez automatiquement la probabilité d'une queue! Si vous connaissez la probabilité que quelque chose se produise, vous connaissez la probabilité que cela ne se produise PAS (le complément)!

Le dernier axiome est fermé sous les unions comptables. Laissez-moi vous donner un autre exemple stupide. Considérons le résultat d’un dé, ou 𝑋 = {1,2,3,4,5,6}. Et si je vous disais que l'algèbre est {∅, 𝑋, {1}, {2}}. C'est-à-dire que je connais la probabilité d'obtenir un 1 ou un 2, mais je ne connais pas la probabilité d'obtenir un 1 ou un 2. Encore une fois, vous m'appelleriez à juste titre comme un idiot (j'espère que la raison est claire). Que se passe-t-il lorsque les ensembles ne sont pas disjoints et que se passe-t-il avec les innombrables unions est un peu plus compliqué, mais j'espère que vous pourrez essayer de penser à quelques exemples.

σ

Eh bien, ce n'est pas un cas tout à fait propre, mais il y a quelques raisons solides pour lesquelles .

Pourquoi les probabilistes ont-ils besoin de mesures?

σσP

Les gens apportent le set de Vitali et Banach-Tarski pour expliquer pourquoi vous avez besoin de la théorie de la mesure, mais je pense que c'est trompeur . L'ensemble de Vitali ne s'éloigne que pour les mesures (non triviales) invariantes à la traduction, que les espaces de probabilité n'exigent pas. Et Banach-Tarski nécessite une invariance par rotation. Les gens se soucient de l' analyse, mais en fait probabilistes ne le font pas .

La raison d'être de la théorie des mesures dans la théorie des probabilités est d'unifier le traitement des véhicules de camping discrets et continus et, de plus, de permettre les véhicules de camping mixtes et les véhicules de camping qui ne le sont tout simplement pas.

Yatharth Agarwal
la source
σσ