Pourquoi les variables aléatoires sont-elles définies comme des fonctions?

21

J'ai du mal à comprendre le concept d'une variable aléatoire en tant que fonction. Je comprends la mécanique (je pense) mais je ne comprends pas la motivation ...

Disons que est un triple de probabilité, où , est l'algèbre de Borel- sur cet intervalle et est la mesure régulière de Lebesgue. Soit une variable aléatoire de à telle que , , ..., , donc a une distribution uniforme discrète sur les valeurs 1 à 6. Ω = [ 0 , 1 ] B de P X B { 1 , 2 , 3 , 4 , 5 , 6 } X ( [ 0 , 1 / 6 ) ) = 1 X ( [ 1 / 6 , 2 / six ) ) = 2 X ( [(Ω,B,P)Ω=[0,1]BσPXB{1,2,3,4,5,6}X([0,1/6))=1X([1/6,2/6))=2XX([5/6,1])=6X

C'est très bien, mais je ne comprends pas la nécessité du triple de probabilité d'origine ... nous aurions pu construire directement quelque chose d'équivalent comme où est toute l' algèbre appropriée de l'espace, et est une mesure qui attribue à chaque sous-ensemble la mesure (# d'éléments) / 6. De plus, le choix de était arbitraire - il aurait pu être , ou tout autre ensemble.S σ P x Ω = [ 0 , 1 ] [ 0 , 2 ]({1,2,3,4,5,6},S,PX)SσPXΩ=[0,1][0,2]

Donc ma question est, pourquoi s'embêter à construire un arbitraire avec une \ sigma -algèbre et une mesure, et définir une variable aléatoire comme une carte de la \ sigma- algèbre à la ligne réelle? σ σΩσσ

Leo Vasquez
la source
5
Notez que la variable aléatoire est la fonction de Ω à R , pas de B à R . La condition est que la variable aléatoire soit mesurable par rapport à B .
mpiktas

Réponses:

21

Si vous vous demandez pourquoi toutes ces machines sont utilisées alors que quelque chose de beaucoup plus simple pourrait suffire - vous avez raison, pour la plupart des situations courantes. Cependant, la version théorique de la probabilité de la mesure a été développée par Kolmogorov dans le but d'établir une théorie d'une telle généralité qu'elle pourrait gérer, dans certains cas, des espaces de probabilité très abstraits et compliqués. En fait, les fondements théoriques de la mesure de la probabilité de Kolmogorov ont finalement permis d'appliquer des outils probabilistes bien au-delà de leur domaine d'application d'origine dans des domaines tels que l'analyse harmonique.

Au début, il semble plus simple d'ignorer tout algèbre "sous-jacent" et d'attribuer simplement des masses de probabilité aux événements constituant l'espace échantillon directement, comme vous l'avez proposé. En effet, les probabilistes font effectivement la même chose chaque fois qu'ils choisissent de travailler avec la "mesure induite" sur l'espace échantillon défini par . Cependant, les choses commencent à devenir délicates lorsque vous commencez à pénétrer dans des espaces de dimensions infinies. Supposons que vous vouliez prouver la loi forte des grands nombres pour le cas spécifique du retournement de pièces justes (c'est-à-dire que la proportion de têtes tend arbitrairement près à 1/2 lorsque le nombre de tours de pièces va à l'infini). Vous pouvez essayer de construire unΩσΩ σ ( H , T , H , . . . ) Ω = [ 0 , 1 ) 0,10100 ...PX-1σ-algèbre sur l'ensemble des séquences infinies de la forme . Mais ici, nous pouvons constater qu'il est beaucoup plus pratique de prendre l'espace sous-jacent pour être ; puis utiliser les représentations binaires de nombres réels (par exemple ) pour représenter des séquences de retournements de pièces (1 étant des têtes, 0 étant des queues.) Une illustration de cet exemple même peut être trouvée dans les premiers chapitres de la probabilité de Billingsley et Mesurez .(H,T,H,...)Ω=[0,1)0,10100 ...

charles.y.zheng
la source
Merci! Je vais vérifier ce livre. Cependant, puisque le est encore arbitraire (il pourrait tout aussi bien être dans votre exemple, est l'intervalle unitaire ou l'espace "préféré" qui fonctionnera dans tous conditions? Ou existe-t-il des situations où un plus compliqué , comme serait bénéfique? [ 0 , 2 ) [ 0 , 1 ] [ 0 , 1 ) Ω R 2Ω[0,2)[0,1][0,1)ΩR2
Leo Vasquez
2
@Leo: Oui. Les processus stochastiques en temps continu en fournissent un exemple. L'exemple canonique est le mouvement brownien, où l'espace échantillon est considéré comme , l'espace de toutes les fonctions continues à valeur réelle. CΩC
cardinal
1
@NRH, oui, j'aurais dû dire peut être pris au lieu de est pris . J'essayais (un peu à dessein) de passer ça sous le tapis.
cardinal
1
@cardinal, dans le commentaire de @ Leo, il a été demandé si est "préféré" en toutes circonstances. Je dis simplement que l'OMI n'existe pas tel et qu'il est avantageux de ne rien exiger sur en général. Lorsque vous souhaitez travailler avec un exemple spécifique, il peut y avoir des raisons de choisir un spécifique . Notez cependant que la «tautologie» balaie sous le tapis que l' existence du mouvement brownien comme mesure de probabilité sur doit être établie. Ω Ω Ω C[0,1]ΩΩΩC
NRH
2
@NRH, désolé pour ma lenteur d'esprit aujourd'hui. Je n'avais pas réussi à connecter la référence préférée au commentaire précédent de @ Leo. Merci. En ce qui concerne la remarque sur la "tautologie", mon point de vue était que dans d'autres constructions, la continuité des trajets d'échantillonnage est un théorème , tandis que, sous la construction basée sur avec carte d'identité, elle est tautologique. Bien sûr, le fait que BM puisse être construit de cette façon doit d'abord être démontré. Mais c'est un peu hors de propos. C
cardinal
10

Les problèmes concernant -algebras sont des subtilités mathématiques, qui n'expliquent pas vraiment pourquoi ou si nous avons besoin d'un espace de fond . En effet, je dirais qu'il n'y a aucune preuve convaincante que l'espace de fond est une nécessité. Pour toute configuration probabiliste où est l'espace d'échantillonnage, l' et une mesure de probabilité, l'intérêt est dans , et il y a aucune raison abstraite que nous voulons que soit la mesure d'image d'une carte mesurable .( E , E , μ ) E E σ μ μ μ X : ( Ω , B ) ( E , E )σ(E,E,μ)EEσμμμX:(Ω,B)(E,E)

Cependant, l'utilisation d'un espace d'arrière-plan abstrait donne une commodité mathématique qui fait que de nombreux résultats semblent plus naturels et intuitifs. L'objectif est toujours de dire quelque chose sur , la répartition de , mais il peut être plus facile et plus clairement exprimée en termes de .X XμXX

Un exemple est donné par le théorème central limite. Si sont des valeurs réelles iid avec la moyenne μ et la variance σ 2, le CLT dit que P ( X1,,Xnμσ2Φest la fonction de distribution pour la distribution normale standard. Si la distribution deestle résultat correspondant en termes de mesure se lit Une explication de la terminologie est nécessaire. Parnous entendons laconvolutionfois de

P(nσ(1nje=1nXje-ξ)X)Φ(X)
Φ μ ρ Xjeμμnnμρcρc(x)=cxτξτξ(x)=x-ξ
ρn/στξρ1/n(μn)((,x])Φ(x)
μnnμ(la distribution de la somme). Les fonctions sont les fonctions linéaires et est la traduction . On pourrait probablement s'habituer à la deuxième formulation, mais elle fait un bon travail pour cacher de quoi il s'agit.ρcρc(x)=cxτξτξ(x)=xξ

Ce qui semble être le problème est que les transformations arithmétiques impliquées dans le CLT sont assez clairement exprimées en termes de variables aléatoires mais elles ne se traduisent pas si bien en termes de mesures.

NRH
la source
(+1) Bonne description. Je pense que l'autre raison pour laquelle l'ancienne notation est si populaire est qu'elle se traduit plus naturellement par des notions intuitives dans les applications. (A voté il y a plusieurs heures.)
Cardinal
@cardinal, merci d'avoir clarifié ce point. Il semble plus naturel de penser et d'argumenter en termes de somme de variables, pas de convolution de mesures de probabilité, et nous aimerions que les mathématiques reflètent cela.
NRH
0

Je suis récemment tombé sur cette nouvelle façon de penser à la variable aléatoire ainsi qu'à l'espace de fond . Je ne sais pas si c'est la question que vous cherchiez, car ce n'est pas une raison mathématique, mais je pense que cela fournit une façon très nette de penser aux VR.ΩXΩ

Imaginez une situation dans laquelle nous jetons une pièce. Cette configuration expérimentale consiste en un ensemble de conditions initiales possibles qui incluent la description physique de la façon dont la pièce est lancée. L'espace d'arrière-plan comprend toutes ces conditions initiales possibles. Par souci de simplicité, nous pourrions supposer que les lancers de pièces de monnaie ne varient qu'en vitesse, alors nous définirionsΩ=[0,vmuneX]

XωΩ

Pour le RV: la mesure correspondrait alors à la mesure de probabilité sur les conditions initiales qui, avec la dynamique de l'expérience représentée par détermine la distribution de probabilité sur les résultats.Q XX:([0,vmuneX],B[0,vmuneX],Q)({0,1},2{0,1})QX

Pour référence de cette idée, vous pouvez consulter les chapitres de Tim Maudlin ou Micheal Strevens dans "Probabilties in Physics" (2011)

Sébastien
la source