Une façon de penser à la représentation conditionnelle est comme une projection sur le -algèbre .σ Gσg
( de Wikimedia commons )
C'est en fait rigoureusement vrai lorsque l'on parle de variables aléatoires intégrables au carré; dans ce cas, est en fait la projection orthogonale de la variable aléatoire sur le sous-espace de constitué de variables aléatoires mesurables par rapport à . Et en fait, cela s'avère même vrai dans un certain sens pour variables aléatoires via l'approximation par variables aléatoires.E [ ξ | G ] ξ L 2 ( Ω ) G L 1 L 2E [ξ| g]ξL2( Ω )gL1L2
(Voir les commentaires pour les références.)
Si l'on considère les algèbres comme représentant la quantité d'informations dont nous disposons (une interprétation qui est de rigueur dans la théorie des processus stochastiques), alors de plus grandes algèbres signifient plus d'événements possibles et donc plus d'informations sur les résultats possibles, tout en étant plus petites algèbres signifie moins d'événements possibles et donc moins d'informations sur les résultats possibles.σ - σ - σ -σ-σ-σ-
Par conséquent, la projection de la variable aléatoire sur la plus petite algèbre signifie faire notre meilleure estimation de la valeur de étant donné les informations plus limitées disponibles à partir de .F ξ σ - G ξ GFξσ-gξg
En d'autres termes, étant donné uniquement les informations de , et non l'ensemble des informations de , est dans un sens rigoureux notre meilleur estimation possible de la variable aléatoire .G F E [ ξ | G ] ξgFE [ξ| g]ξ
En ce qui concerne votre exemple, je pense que vous pourriez confondre les variables aléatoires et leurs valeurs. Une variable aléatoire est une fonction dont le domaine est l'espace des événements; ce n'est pas un nombre. En d'autres termes, , alors que pour un , .X X : Ω → R X ∈ { f | f : Ω → R } ω ∈ Ω X ( ω ) ∈ RXX: Ω → R X∈ { f | f: Ω → R }ω ∈ ΩX( ω ) ∈ R
La notation de l'espérance conditionnelle, à mon avis, est vraiment mauvaise, car c'est une variable aléatoire elle-même, c'est-à-dire aussi une fonction . En revanche, l'attente (régulière) d'une variable aléatoire est un nombre . L'espérance conditionnelle d'une variable aléatoire est une quantité entièrement différente de l'attente de la même variable aléatoire, c'est-à-dire que ne vérifie même pas le type avec .E [ ξ | G ] E [ ξ ]E[ξ|G]E[ξ]
En d'autres termes, utiliser le symbole pour désigner à la fois une attente régulière et conditionnelle est un très gros abus de notation, ce qui conduit à une confusion inutile.EE
Cela étant dit, notez que est un nombre (la valeur de la variable aléatoire évalué à la valeur ), mais est une variable aléatoire, mais elle se révèle être une variable aléatoire constante (c.-à-d. dégénérée triviale), car la -algebra généré par , est trivial / dégénéré, puis techniquement parlant la valeur constante de cette variable aléatoire constante est , où iciE [ ξ | G ] ( ω ) E [ ξ | G ] ω E [ ξ | Ω ] σ Ω { ∅ , Ω } E [ ξ ]E[ξ|G] ( ω )E[ξ|G]ωE[ξ| Ω]σΩ{∅,Ω}E[ξ] EE dénote une attente régulière et donc un nombre, pas une attente conditionnelle et donc pas une variable aléatoire.
Vous semblez également confus quant à la signification de la notation ; techniquement parlant, il est seulement possible de conditionner les algèbres, pas les événements individuels, car les mesures de probabilité ne sont définies que sur les algèbres complètes , pas les événements individuels. Ainsi, est juste un raccourci (paresseux) pour , où représente l' algèbre générée par l'événement , qui est . Notez que ; en d'autres termes, ,E [ ξ | A ] σ - σ - E [ ξ | A ] E [ ξ | σ ( A ) ] σ ( A ) σ - A { ∅ , A , A c , Ω } σ ( A )E[ξ|A]σ−σ−E[ξ|A]E[ξ|σ(A)]σ(A)σ−A{ ∅,A,Ac, Ω } = G = σ ( A c ) E [ ξ | A ]σ( A)=G=σ(Ac)E[ξ| A] E[ ξ | G ] E [ ξ | A c ]E[ξ|G] et sont toutes des façons différentes de désigner exactement le même objet .E[ξ|Ac]
Enfin, je veux juste ajouter que l'explication intuitive que j'ai donnée ci-dessus explique pourquoi la valeur constante de la variable aléatoire est juste le nombre - le algebra représente le moins d'informations que nous puissions avoir, en fait, essentiellement aucune information, donc dans cette circonstance extrême, la meilleure supposition possible que nous pourrions avoir pour laquelle la variable aléatoire est la variable aléatoire constante dont la valeur constante est .E [ ξ | Ω ] = E [ ξ | σ ( Ω ) ] = E [ ξ | { ∅ , Ω } ] E [ ξ ] σ -E [ξ| Ω]= E [ξ|σ( Ω ) ] = E [ξ| {∅,Ω}]E [ξ]σ- { ∅ , Ω } ξ E [ ξ ]{ ∅ , Ω}ξE[ξ]
Notez que toutes les variables aléatoires constantes sont des variables aléatoires , et elles sont toutes mesurables par rapport à la trivial -algebra , donc nous avons en effet cette constante aléatoire est la projection orthogonale de sur le sous-espace de constitué de variables aléatoires mesurables par rapport à , comme cela a été revendiqué.L 2 σ { ∅ , Ω } E [ ξ ] ξ L 2 ( Ω ) { ∅ , Ω }L2σ{ ∅ , Ω }E[ξ]ξL2( Ω ){ ∅ , Ω }
Je vais essayer d'élaborer ce que William a suggéré.
Soit l'espace de l'échantillon pour lancer deux fois une pièce. Définissez la course. var. pour être le num. des têtes qui se produisent dans l'expérience. Clairement, . Une façon de penser à ce que , en tant qu'expec. , représente est la meilleure estimation possible pour . Si nous devions deviner quelle valeur prendrait, nous devinerions . En effet, pour tout nombre réel .Ω ξ E [ ξ ] = 1 1 ξ ξ 1 E [ ( ξ - 1Ω ξ E[ξ] = 1 1 ξ ξ 1 ) 2 ] ≤ E [ ( ξ - a ) 2 ] aE[ (ξ- 1 )2] ≤E[ (ξ- a )2] une
Notons comme étant l'événement dont le premier résultat est une tête. Soit soit le -alg. gen. par . Nous pensons que représente ce que nous savons après le premier lancer. Après le premier lancer, soit des têtes se sont produites, soit des têtes ne se sont pas produites. Par conséquent, nous sommes soit dans l'événement ou après le premier lancer.A = { H T , H H } G = { ∅ , A , A c , Ω }A={HT,HH} G={∅,A,Ac,Ω} σ A G A A cσ A G A Ac
Si nous sommes dans l'événement , alors la meilleure estimation possible pour serait , et si nous sommes dans l'événement , alors la meilleure estimation possible pour serait .A ξ E [ ξ | A ] = 1,5 AA ξ E[ξ|A]=1.5 c ξ E [ ξ | A c ] =Ac ξ 0,5E[ξ|Ac]=0.5
Définissez maintenant le run. var. pour être soit ou en fonction de si oui ou non . Cela a fonctionné. var. , est une meilleure approximation que puisque .η ( ω )η(ω) 1,5 0,5 ω ∈ A η 1 = E [ ξ ] E [ ( ξ - η ) 2 ] ≤ E [ ( ξ - 1 ) 21.5 0.5 ω∈A η 1=E[ξ] ]E[(ξ−η)2]≤E[(ξ−1)2]
Ce que fait est de répondre à la question: quelle est la meilleure estimation de après le premier lancer? Comme nous ne savons pas les informations après le premier tirage au sort, dépendra . Une fois que l'événement est révélé, après le premier lancer, la valeur de est déterminée et fournit la meilleure estimation possible pour . η ξ η A G ηη ξ η A G η ξξ
Le problème avec l'utilisation de comme sa propre estimation, c'est-à-dire est le suivant. n'est pas bien défini après le premier lancer. Disons que le résultat de l'expérience est avec le premier résultat étant des têtes, nous sommes dans l'événement , mais qu'est-ce queNous ne savons pas dès le premier tirage au sort, cette valeur est ambiguë pour nous, et donc n'est pas bien défini. Plus formellement, nous disons que n'est pas mesurable, c'est-à-dire que sa valeur n'est pas bien définie après le premier lancer. Ainsi, est la meilleure estimation possible deξ 0 = E [ ( ξ - ξ ) 2 ] ≤ E [ ( ξ - η ) 2 ] ξ ω A ξ ( ω ) = ? ξ ξ G η ξξ 0=E[(ξ−ξ)2]≤E[(ξ−η)2] ξ ω UNE ξ( ω ) = ? ξ ξ g η ξ après le premier lancer.
Peut-être que quelqu'un ici peut trouver un exemple plus sophistiqué en utilisant l'espace échantillon , avec , et quelques algèbre non triviaux .[ 0 , 1 ] ξ ( ω ) = ω G σ[ 0 , 1 ] ξ( ω ) = ω g σ
la source
Bien que vous demandiez de ne pas utiliser la définition formelle, je pense que la définition formelle est probablement la meilleure façon de l'expliquer.
Wikipédia - attente conditionnelle :
Premièrement, il s'agit d'une fonction . Deuxièmement, il doit correspondre à l'attente sur chaque (sous-) ensemble mesurable dans . Donc, pour un événement, A, l'algèbre sigma est , il est donc clairement défini comme vous l'avez spécifié dans votre question pour . De même pour toute variable aléatoire discrète (et leurs combinaisons), nous listons tous les événements primitifs et attribuons l'attente compte tenu de cet événement primitif.H H {A,AC,∅,Ω}ω∈A/AcH H {A,AC,∅,Ω} ω∈A/Ac
Pensez maintenant à lancer une pièce un nombre infini de fois, où à chaque lancer i, vous obtenez , si votre pièce est pile, alors vos gains totaux sont où = 1 pour les queues et 0 pour les têtes. Alors X est une vraie variable aléatoire sur . Après n lancers de pièces, vous connaissez la valeur de X avec une précision de , par exemple après 2 lancers de pièces, elle est en [0,1 / 4], [1 / 4,1 / 2], [1/2, 3/4] ou [3 / 4,1] - après chaque tirage au sort, votre algèbre sigma associée devient de plus en plus fine, et de même, l'attente conditionnelle de X devient de plus en plus précise.1 / 2 i X = Σ ∞ i = 1 11/2i 2 i cici[0,1]1/2nX=∑∞i=112ici ci [0,1] 1/2n
Espérons que cet exemple de variable aléatoire à valeur réelle avec une séquence d'algèbres sigma de plus en plus fines (Filtration) vous éloigne de l'intuition purement événementielle à laquelle vous êtes habitué et clarifie son objectif.
la source