Je suppose que vous êtes à l'aise avec le fait de considérer le triangle rectangle comme signifiant que et sont des variables aléatoires non corrélées . Pour les variables aléatoires non corrélées et ,
et donc si nous définissons et pour que , nous obtenons que
Il reste à montrer que est le même que
E[ Oui∣ X]Oui- E[ Oui∣ X]UNEB
var( A + B ) = var( A ) + var( B ) ,(1)
A = Y- E[ Oui∣ X]B = E[ Oui∣ X]A + B = Yvar( Y) = var( Y- E[ Oui∣ X] ) + var( E[ Oui∣ X] ) .(2)
var( Y- E[ Oui∣ X] )E[ var( Y∣ X) ] afin que nous puissions reformuler comme
qui est la formule de variance totale.
( 2 )var( Y) = E[ var( Y∣ X) ] + var( E[ Oui∣ X] )(3)
Il est bien connu que la valeur attendue de la variable aléatoire est , c'est-à-dire . Nous voyons donc que
d'où il s'ensuit que , c'est-à-dire
Soit la variable aléatoire pour que nous puissions écrire ce
Mais,
où
E [ Y ] E [ E [ Y ∣ X ] ] = E [ Y ] E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ E [ Y ∣ X ] ] = 0 , var ( AE[ Oui∣ X]E[ Oui]E[ E[ Oui∣ X]]=E[Y]
E[A]=E[Y−E[Y∣X]]=E[Y]−E[E[Y∣X]]=0,
var ( Y - E [ Y ∣ X ] ) = E [ ( Y - E [ Y ∣ X ] ) 2 ] . C ( Y - E [ Y ∣ X ] ) 2 var ( Y - E [ Y ∣ X ] ) = E [ Cvar(A)=E[A2]var(Y−E[Y∣X])=E[(Y−E[Y∣X])2].(4)
C(Y−E[Y∣X])2E[C]=E [ E[C∣X] ] E[C∣X]=E [ (Y-E[Y∣X])2 | X ] . X=xYE[Y∣X=x]E [ (Y-E[Y∣var(Y−E[Y∣X])=E[C].(5)
E[C]=E[E[C∣X]]E[ C∣ X] = E[ ( O- E[ Oui∣ X] )2∣∣X] .
Maintenant,
étant donné que , la distribution conditionnelle de a la moyenne
et donc
En d'autres termes, sorte que la
variable aléatoire soit juste . Par conséquent,
qui lors de la substitution en montre cette
X= xOuiE[ Oui∣ X= x ]E [ C ∣ X = x ] = var ( Y ∣ X = x )E[ (O- E[ Oui∣ X= x ] )2∣∣X= x ] = var( Y∣ X= x ) .
E[ C∣ X= x ] = var( Y∣ X= x ) var ( Y ∣ X ) E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] , ( 5 ) var ( Y - E [ Y ∣ X ] ) = E [ var ( Y ∣ X )E[ C∣ X]var( Y∣ X)E[ C] = E[ E[ C∣ X]]=E[var(Y∣X)],(6)
(5)var(Y−E[Y∣X])=E[var(Y∣X)].
Cela rend le côté droit de exactement ce dont nous avons besoin et nous avons donc prouvé la formule de variance totale .
( 3 )(2)(3)
Déclaration:
Le théorème de Pythagore dit, pour tout élément et d'un espace de produit intérieur avec des normes finies telles que , En d'autres termes, pour les vecteurs orthogonaux, la longueur au carré de la somme est la somme des longueurs au carré.T1 T2 ⟨ T1, T2⟩ = 0
Notre cas:
Dans notre cas, et sont des variables aléatoires, la norme au carré est et le produit intérieur . La traduction en langage statistique nous donne: car . Nous pouvons faire en sorte que cela ressemble davantage à votre loi de variance totale si nous changeons en ...T1= E( Y| X) T2= Y- E[ Oui| X] | | Tje| |2= E[ T2je] ⟨ T1, T2⟩ = E[ T1T2] ( 1 )
Soustrayez des deux côtés, en faisant le côté gauche ,( E[ Oui] )2 Var[ Oui]
Notant à droite que ,E[ { E( Y| X) }2] - ( E[ Oui] )2= Var( E[ Oui| X] )
Notant que .E[ ( O- E[ Oui| X] )2] = E[ E{ ( Y- E[ Oui| X] )2} | X] = E[ Var( Y| X) ]
Pour plus de détails sur ces trois points, voir le post de @ DilipSarwate. Il explique tout cela plus en détail que moi.
la source