Intuition pour l'attente conditionnelle de -algebra

20

Soit un espace de probabilité, étant donné une variable aléatoire et une -algebra nous pouvons construire une nouvelle variable aléatoire , qui est l'espérance conditionnelle.( Ω , F , μ ) (Ω,F,μ)ξ : Ω Rξ:ΩR σ σGFGF E [ ξ |G ]E[ξ|G]


Quelle est exactement l'intuition de penser à ? Je comprends l'intuition des éléments suivants:E [ ξ | g ]E[ξ|G]

(i) où est un événement (avec une probabilité positive).E [ ξ | A ]E[ξ|A] AA

(ii) où est une variable aléatoire discrète.E [ ξ | η ]E[ξ|η] ηη

Mais je ne peux pas visualiser . J'en comprends les mathématiques et je comprends qu'il est défini de manière à généraliser les cas les plus simples que nous pouvons visualiser. Mais néanmoins, je ne trouve pas cette façon de penser utile. Cela reste pour moi un objet mystérieux.E [ ξ |G ]E[ξ|G]


Par exemple, soit un événement avec . Former le -algèbre , celui généré par . Alors serait égal à if , et égal à si . En d'autres termes, if , et si .A Aμ ( A ) > 0 μ(A)>0σ σG = { , A , A c , Ω } G={,A,Ac,Ω}A AE [ ξ | G ] ( ω ) E[ξ|G](ω)1μ ( A )Aξ1μ(A)AξωAωA1μ ( A c )Acξ1μ(Ac)AcξωAωAE[ξ| G](ω)=E[ξ| A]E[ξ|G](ω)=E[ξ|A]ωAωAE[ξ| G](ω)=E[ξ| Ac]E[ξ|G](ω)=E[ξ|Ac]ωAcωAc

La partie qui prête à confusion est que ω ΩωΩ , alors pourquoi ne pas simplement écrire E [ ξ | G ] ( ω ) = E [ ξ | Ω ] = E [ ξ ]E[ξ|G](ω)=E[ξ|Ω]=E[ξ] ? Pourquoi remplaçons-nous E [ ξ | G ]E[ξ|G] par E [ ξ | A  ou  A c ]E[ξ|A or Ac] selon que \ oméga \ soit ou non dans Aω AωA , mais pas autorisé à remplacer E [ ξ | G ]E[ξ|G] par E [ ξ ]E[ξ] ?


Remarque. En répondant à cette question, n'expliquez pas cela en utilisant la définition rigoureuse de l'attente conditionnelle. Je comprends que. Ce que je veux comprendre, c'est ce que l'attente conditionnelle est censée calculer et pourquoi nous en rejetons une à la place d'une autre.

Nicolas Bourbaki
la source

Réponses:

16

Une façon de penser à la représentation conditionnelle est comme une projection sur le -algèbre .σ Gσg

entrez la description de l'image ici( de Wikimedia commons )

C'est en fait rigoureusement vrai lorsque l'on parle de variables aléatoires intégrables au carré; dans ce cas, est en fait la projection orthogonale de la variable aléatoire sur le sous-espace de constitué de variables aléatoires mesurables par rapport à . Et en fait, cela s'avère même vrai dans un certain sens pour variables aléatoires via l'approximation par variables aléatoires.E [ ξ | G ] ξ L 2 ( Ω ) G L 1 L 2E [ξ| g]ξL2( Ω )gL1L2

(Voir les commentaires pour les références.)

Si l'on considère les algèbres comme représentant la quantité d'informations dont nous disposons (une interprétation qui est de rigueur dans la théorie des processus stochastiques), alors de plus grandes algèbres signifient plus d'événements possibles et donc plus d'informations sur les résultats possibles, tout en étant plus petites algèbres signifie moins d'événements possibles et donc moins d'informations sur les résultats possibles.σ - σ - σ -σ-σ-σ-

Par conséquent, la projection de la variable aléatoire sur la plus petite algèbre signifie faire notre meilleure estimation de la valeur de étant donné les informations plus limitées disponibles à partir de .F ξ σ - G ξ GFξσ-gξg

En d'autres termes, étant donné uniquement les informations de , et non l'ensemble des informations de , est dans un sens rigoureux notre meilleur estimation possible de la variable aléatoire .G F E [ ξ | G ] ξgFE [ξ| g]ξ


En ce qui concerne votre exemple, je pense que vous pourriez confondre les variables aléatoires et leurs valeurs. Une variable aléatoire est une fonction dont le domaine est l'espace des événements; ce n'est pas un nombre. En d'autres termes, , alors que pour un , .X X : Ω R X { f | f : Ω R } ω Ω X ( ω ) RXX: Ω R  X{ f | f: Ω R }ω ΩX( ω ) R

La notation de l'espérance conditionnelle, à mon avis, est vraiment mauvaise, car c'est une variable aléatoire elle-même, c'est-à-dire aussi une fonction . En revanche, l'attente (régulière) d'une variable aléatoire est un nombre . L'espérance conditionnelle d'une variable aléatoire est une quantité entièrement différente de l'attente de la même variable aléatoire, c'est-à-dire que ne vérifie même pas le type avec .E [ ξ | G ] E [ ξ ]E[ξ|G]E[ξ]

En d'autres termes, utiliser le symbole pour désigner à la fois une attente régulière et conditionnelle est un très gros abus de notation, ce qui conduit à une confusion inutile.EE

Cela étant dit, notez que est un nombre (la valeur de la variable aléatoire évalué à la valeur ), mais est une variable aléatoire, mais elle se révèle être une variable aléatoire constante (c.-à-d. dégénérée triviale), car la -algebra généré par , est trivial / dégénéré, puis techniquement parlant la valeur constante de cette variable aléatoire constante est , où iciE [ ξ | G ] ( ω ) E [ ξ | G ] ω E [ ξ | Ω ] σ Ω { , Ω } E [ ξ ]E[ξ|G] ( ω )E[ξ|G]ωE[ξ| Ω]σΩ{,Ω}E[ξ] EE dénote une attente régulière et donc un nombre, pas une attente conditionnelle et donc pas une variable aléatoire.

Vous semblez également confus quant à la signification de la notation ; techniquement parlant, il est seulement possible de conditionner les algèbres, pas les événements individuels, car les mesures de probabilité ne sont définies que sur les algèbres complètes , pas les événements individuels. Ainsi, est juste un raccourci (paresseux) pour , où représente l' algèbre générée par l'événement , qui est . Notez que ; en d'autres termes, ,E [ ξ | A ] σ - σ - E [ ξ | A ] E [ ξ | σ ( A ) ] σ ( A ) σ - A { , A , A c , Ω } σ ( A )E[ξ|A]σσE[ξ|A]E[ξ|σ(A)]σ(A)σA{ ,A,Ac, Ω } = G = σ ( A c ) E [ ξ | A ]σ( A)=G=σ(Ac)E[ξ| A] E[ ξ | G ] E [ ξ | A c ]E[ξ|G] et sont toutes des façons différentes de désigner exactement le même objet .E[ξ|Ac]

Enfin, je veux juste ajouter que l'explication intuitive que j'ai donnée ci-dessus explique pourquoi la valeur constante de la variable aléatoire est juste le nombre - le algebra représente le moins d'informations que nous puissions avoir, en fait, essentiellement aucune information, donc dans cette circonstance extrême, la meilleure supposition possible que nous pourrions avoir pour laquelle la variable aléatoire est la variable aléatoire constante dont la valeur constante est .E [ ξ | Ω ] = E [ ξ | σ ( Ω ) ] = E [ ξ | { , Ω } ] E [ ξ ] σ -E [ξ| Ω]= E [ξ|σ( Ω ) ] = E [ξ| {,Ω}]E [ξ]σ- { , Ω } ξ E [ ξ ]{ , Ω}ξE[ξ]

Notez que toutes les variables aléatoires constantes sont des variables aléatoires , et elles sont toutes mesurables par rapport à la trivial -algebra , donc nous avons en effet cette constante aléatoire est la projection orthogonale de sur le sous-espace de constitué de variables aléatoires mesurables par rapport à , comme cela a été revendiqué.L 2 σ { , Ω } E [ ξ ] ξ L 2 ( Ω ) { , Ω }L2σ{ , Ω }E[ξ]ξL2( Ω ){ , Ω }

Chill2Macht
la source
2
@William, je ne suis pas d'accord avec vous sur l'utilisation de comme var. De nombreux livres définissent comme un nombre, et non comme une var. Il s'agit de la meilleure estimation possible de . C'est une notion utile et très intuitive. L'ignorer complètement, juste parce que vous avez une notion généralisée de cond exp car un var var est faux d'un point de vue pédagogique. Je ne suis pas confus au sujet de ce qu'est un RV, et je ne vois pas comment tout ce que j'ai écrit vous amènerait à penser comme ça. E [ ξ | A ] E [ ξ | A ]E[ξ| A]E[ ξ| A] ξ | UNEξ|UNE
Nicolas Bourbaki
1
@William Penser à cond expe comme une estimation de la var courue avec représentant des informations, est quelque chose que j'ai déjà vu, mais je n'y ai jamais réfléchi autant et j'ai essayé de trouver une façon différente de visualiser cond expec. En utilisant votre suggestion, je vais écrire un exemple simple et le poster en tant que réponse, pour moi-même et pour d'autres personnes. Peut-être que certaines personnes pourront alors développer mon exemple et en donner un plus exotique. gg
Nicolas Bourbaki
1
@NicolasBourbaki Je vous recommande de consulter la p.221 de la 4e édition de Durrett's Probability - Theory and Examples . Je peux vous référer à d'autres sources qui en discutent également. En tout cas, ce n'est pas vraiment une question d'opinion - dans le cas le plus général, une attente conditionnelle est une variable aléatoire, et le conditionnement n'est fait que par rapport aux algèbres; le conditionnement par rapport à un événement est le conditionnement par rapport à l' algèbre générée par l'événement, et le conditionnement par rapport à une variable aléatoire conditionne par rapport à l' algèbre générée par le VRσ - σ - σσ-σ-σ
Chill2Macht
3
@William Et je peux vous référer à des sources qui définissent la condition. exep. d'un événement pour être un vrai nombre. Je ne sais pas pourquoi vous êtes si coincé sur ce point. On peut le définir de toute façon, tant que les notions ne sont pas mélangées. Pour des raisons pédagogiques, l'enseignement d'une classe sur prob. théorie, et sauter instantanément dans la déf. la plus générale., n'est pas éclairant. Dans les deux cas, cela n'a vraiment pas d'importance dans cette discussion, et votre plainte concerne la notation / sémantique.
Nicolas Bourbaki
1
@NicolasBourbaki Le chapitre 5 de Whittle's Probability via Expectation donne un très bon compte (à mon avis) des deux caractérisations de l'attente conditionnelle, et explique bien comment chaque définition se rapporte et est motivée par l'autre définition. Vous avez raison de dire que la distinction est une autre sémantique. Mon enthousiasme pour la définition plus générale découle (je pense) de la lecture de ce chapitre (5 de la probabilité de Whittle via l'attente ), qui a fait (je crois) de bons arguments sur la façon dont la définition plus générale est à certains égards plus facile à comprendre.
Chill2Macht
3

Je vais essayer d'élaborer ce que William a suggéré.

Soit l'espace de l'échantillon pour lancer deux fois une pièce. Définissez la course. var. pour être le num. des têtes qui se produisent dans l'expérience. Clairement, . Une façon de penser à ce que , en tant qu'expec. , représente est la meilleure estimation possible pour . Si nous devions deviner quelle valeur prendrait, nous devinerions . En effet, pour tout nombre réel .Ω ξ E [ ξ ] = 1 1 ξ ξ 1 E [ ( ξ - 1ΩξE[ξ] = 11ξξ1 ) 2 ] E [ ( ξ - a ) 2 ] aE[ (ξ- 1 )2] E[ (ξ- a )2]une

Notons comme étant l'événement dont le premier résultat est une tête. Soit soit le -alg. gen. par . Nous pensons que représente ce que nous savons après le premier lancer. Après le premier lancer, soit des têtes se sont produites, soit des têtes ne se sont pas produites. Par conséquent, nous sommes soit dans l'événement ou après le premier lancer.A = { H T , H H } G = { , A , A c , Ω }A={HT,HH}G={,A,Ac,Ω} σ A G A A cσAGAAc

Si nous sommes dans l'événement , alors la meilleure estimation possible pour serait , et si nous sommes dans l'événement , alors la meilleure estimation possible pour serait .A ξ E [ ξ | A ] = 1,5 AAξE[ξ|A]=1.5 c ξ E [ ξ | A c ] =Acξ 0,5E[ξ|Ac]=0.5

Définissez maintenant le run. var. pour être soit ou en fonction de si oui ou non . Cela a fonctionné. var. , est une meilleure approximation que puisque .η ( ω )η(ω) 1,5 0,5 ω A η 1 = E [ ξ ] E [ ( ξ - η ) 2 ] E [ ( ξ - 1 ) 21.50.5ωAη1=E[ξ] ]E[(ξη)2]E[(ξ1)2]

Ce que fait est de répondre à la question: quelle est la meilleure estimation de après le premier lancer? Comme nous ne savons pas les informations après le premier tirage au sort, dépendra . Une fois que l'événement est révélé, après le premier lancer, la valeur de est déterminée et fournit la meilleure estimation possible pour . η ξ η A G ηηξηAGη ξξ

Le problème avec l'utilisation de comme sa propre estimation, c'est-à-dire est le suivant. n'est pas bien défini après le premier lancer. Disons que le résultat de l'expérience est avec le premier résultat étant des têtes, nous sommes dans l'événement , mais qu'est-ce queNous ne savons pas dès le premier tirage au sort, cette valeur est ambiguë pour nous, et donc n'est pas bien défini. Plus formellement, nous disons que n'est pas mesurable, c'est-à-dire que sa valeur n'est pas bien définie après le premier lancer. Ainsi, est la meilleure estimation possible deξ 0 = E [ ( ξ - ξ ) 2 ] E [ ( ξ - η ) 2 ] ξ ω A ξ ( ω ) = ? ξ ξ G η ξξ0=E[(ξξ)2]E[(ξη)2]ξωUNEξ( ω ) = ?ξξgηξ après le premier lancer.

Peut-être que quelqu'un ici peut trouver un exemple plus sophistiqué en utilisant l'espace échantillon , avec , et quelques algèbre non triviaux .[ 0 , 1 ] ξ ( ω ) = ω G σ[ 0 , 1 ]ξ( ω ) = ωgσ

Nicolas Bourbaki
la source
1

Bien que vous demandiez de ne pas utiliser la définition formelle, je pense que la définition formelle est probablement la meilleure façon de l'expliquer.

Wikipédia - attente conditionnelle :

Ensuite, une attente conditionnelle de X donnée , notée , est tout Fonction mesurable ( ) qui satisfait:H E(X H ) H Ω R nHE( XH )HΩ Rn

H E(X H )d P =H Xd Ppour chaqueH HHE(XH)dP=HXdPfor eachHH

Premièrement, il s'agit d'une fonction . Deuxièmement, il doit correspondre à l'attente sur chaque (sous-) ensemble mesurable dans . Donc, pour un événement, A, l'algèbre sigma est , il est donc clairement défini comme vous l'avez spécifié dans votre question pour . De même pour toute variable aléatoire discrète (et leurs combinaisons), nous listons tous les événements primitifs et attribuons l'attente compte tenu de cet événement primitif.H H {A,AC,,Ω}ωA/AcHH{A,AC,,Ω}ωA/Ac

Pensez maintenant à lancer une pièce un nombre infini de fois, où à chaque lancer i, vous obtenez , si votre pièce est pile, alors vos gains totaux sont où = 1 pour les queues et 0 pour les têtes. Alors X est une vraie variable aléatoire sur . Après n lancers de pièces, vous connaissez la valeur de X avec une précision de , par exemple après 2 lancers de pièces, elle est en [0,1 / 4], [1 / 4,1 / 2], [1/2, 3/4] ou [3 / 4,1] - après chaque tirage au sort, votre algèbre sigma associée devient de plus en plus fine, et de même, l'attente conditionnelle de X devient de plus en plus précise.1 / 2 i X = Σ i = 1 11/2i2 i cici[0,1]1/2nX=i=112icici[0,1]1/2n

Espérons que cet exemple de variable aléatoire à valeur réelle avec une séquence d'algèbres sigma de plus en plus fines (Filtration) vous éloigne de l'intuition purement événementielle à laquelle vous êtes habitué et clarifie son objectif.

seanv507
la source
Je m'excuse, mais j'ai rétrogradé cette question. Il ne répond pas à ce que j'avais demandé à l'origine. Il ne fournit pas non plus de nouvelles informations que je ne connaissais pas auparavant.
Nicolas Bourbaki
Ce que j'essaye de vous suggérer, c'est que vous ne comprenez pas la définition formelle aussi bien que vous pensez que vous le faites (comme l'autre réponse l'a également suggéré), donc à moins que vous ne résolviez ce qui n'est pas intuitif avec la définition formelle, vous ne progresserez pas.
seanv507
Je comprends très bien la définition officielle. Les questions que j'ai posées, je sais y répondre en travaillant à partir des définitions formelles. L'autre réponse tentait d'expliquer ma question sans utiliser la définition de con. exp.
Nicolas Bourbaki