Loi de la variance totale comme théorème de Pythagore

15

Supposons que et ont un second moment fini. Dans l'espace de Hilbert de variables aléatoires de second moment fini (avec le produit interne de défini par , ), nous pouvons interpréter comme la projection de sur l'espace des fonctions de .XYT1,T2E(T1T2)||T||2=E(T2)E(Y|X)OuiX

Nous savons également que la loi de la variance totale lit

Vuner(Oui)=E(Vuner(Oui|X))+Vuner(E(Oui|X))

Y a-t-il un moyen d'interpréter cette loi en termes de l'image géométrique ci-dessus? On m'a dit que la loi est la même que le théorème de Pythagore pour le triangle rectangle avec les côtés . Je comprends pourquoi le triangle est à angle droit, mais pas comment le théorème de Pythagore capture la loi de la variance totale.Oui,E(Oui|X),Oui-E(Oui|X)

renrenthehamster
la source

Réponses:

7

Je suppose que vous êtes à l'aise avec le fait de considérer le triangle rectangle comme signifiant que et sont des variables aléatoires non corrélées . Pour les variables aléatoires non corrélées et , et donc si nous définissons et pour que , nous obtenons que Il reste à montrer que est le même que E[OuiX]Oui-E[OuiX]UNEB

(1)var(UNE+B)=var(UNE)+var(B),
UNE=Oui-E[OuiX]B=E[OuiX]UNE+B=Oui
(2)var(Oui)=var(Oui-E[OuiX])+var(E[OuiX]).
var(Oui-E[OuiX])E[var(OuiX)] afin que nous puissions reformuler comme qui est la formule de variance totale.(2)
(3)var(Oui)=E[var(OuiX)]+var(E[OuiX])

Il est bien connu que la valeur attendue de la variable aléatoire est , c'est-à-dire . Nous voyons donc que d'où il s'ensuit que , c'est-à-dire Soit la variable aléatoire pour que nous puissions écrire ce Mais, où E [ Y ] E [ E [ Y X ] ] = E [ Y ] E [ A ] = E [ Y - E [ Y X ] ] = E [ Y ] - E [ E [ Y X ] ] = 0 , var ( AE[OuiX]E[Oui]E[E[YX]]=E[Y]

E[A]=E[YE[YX]]=E[Y]E[E[YX]]=0,
var ( Y - E [ Y X ] ) = E [ ( Y - E [ Y X ] ) 2 ] . C ( Y - E [ Y X ] ) 2 var ( Y - E [ Y X ] ) = E [ Cvar(A)=E[A2]
(4)var(YE[YX])=E[(YE[YX])2].
C(YE[YX])2E[C]=E [ E[CX] ] E[CX]=E [ (Y-E[YX])2 | X ] . X=xYE[YX=x]E [ (Y-E[Y
(5)var(YE[YX])=E[C].
E[C]=E[E[CX]]E[CX]=E[(Oui-E[OuiX])2|X]. Maintenant, étant donné que , la distribution conditionnelle de a la moyenne et donc En d'autres termes, sorte que la variable aléatoire soit juste . Par conséquent, qui lors de la substitution en montre cette X=XOuiE[OuiX=X]E [ C X = x ] = var ( Y X = x )
E[(Oui-E[OuiX=X])2|X=X]=var(OuiX=X).
E[CX=X]=var(OuiX=X) var ( Y X ) E [ C ] = E [ E [ C X ] ] = E [ var ( Y X ) ] , ( 5 ) var ( Y - E [ Y X ] ) = E [ var ( Y X )E[CX]var(OuiX)
(6)E[C]=E[E[CX]]=E[var(YX)],
(5)
var(YE[YX])=E[var(YX)].
Cela rend le côté droit de exactement ce dont nous avons besoin et nous avons donc prouvé la formule de variance totale .( 3 )(2)(3)
Dilip Sarwate
la source
YE(Y|X) est une variable avec une moyenne nulle. D'où . Maintenant . Deuxième partie un peu moins compliquée de la réponse. var(YE(Y|X))=E[YE(Y|X)]2Evar(Y|X)=E[E((YE(Y|X))2|X)]=E[YE(Y|X)]2
mpiktas
1
@mpiktas Merci. Je suis conscient de la manière la plus courte d'arriver au résultat souhaité, mais j'ai toujours du mal à l'expliquer de manière à ce que les étudiants débutants puissent suivre facilement. Soit dit en passant, dans la dernière équation que vous avez écrite, la quantité à droite a un exposant mal placé: c'est la quantité entre crochets qui doit être mise au carré; c'est-à-dire que ce devrait être . Trop tard pour le corriger, cependant, à moins qu'un modérateur n'oblige. E[(Oui-E[Oui|X])2]
Dilip Sarwate du
1
Dilip, de nombreux probabilistes interpréteraient correctement l'équation de @ mpiktas telle qu'elle est écrite; le jeu de parenthèses supplémentaire est souvent supprimé. Peut-être que mes yeux me trompent, mais je pense que sa notation est cohérente partout. Je suis heureux de vous aider à arranger les choses, si vous le souhaitez, cependant. :-)
Cardinal
@cardinal Je n'ai pas mal interprété l'écriture de mpiktas et j'ai bien compris ce qu'il disait. Bien que je sois également habitué à interpréter ou comme la valeur attendue de , j'ai toujours des doutes sur , d'autant plus que PEMDAS n'en dit rien. L'attente a-t-elle priorité sur l'exponentiation ou non? Je suppose que je suis juste habitué à ce que l'opérateur d'attente s'applique à tout ce qui se trouve entre crochets. Veuillez ne pas modifier le commentaire de m [iktas, mais si vous souhaitez supprimer tout ce qui se trouve dans ce fil de "Incidemment" dans mon commentaire précédent, veuillez continuer. EXEXXEX2
Dilip Sarwate du
Je suis désolé, @Dilip. Mon intention n'était pas de suggérer que vous ne compreniez pas; Je savais que tu l'avais! Je conviens également que la notation peut se prêter à des ambiguïtés et il est bon de les signaler lorsqu'elles se présentent! Ce que je voulais dire, c'est que je pensais que la deuxième équation dans le commentaire (c'est-à-dire ) la convention qui était utilisée désormais. :-)vuner
Cardinal
2

Déclaration:

Le théorème de Pythagore dit, pour tout élément et d'un espace de produit intérieur avec des normes finies telles que , En d'autres termes, pour les vecteurs orthogonaux, la longueur au carré de la somme est la somme des longueurs au carré.T1T2T1,T2=0

(1)||T1+T2||2=||T1||2+||T2||2.

Notre cas:

Dans notre cas, et sont des variables aléatoires, la norme au carré est et le produit intérieur . La traduction en langage statistique nous donne: car . Nous pouvons faire en sorte que cela ressemble davantage à votre loi de variance totale si nous changeons en ...T1=E(Oui|X)T2=Oui-E[Oui|X]||Tje||2=E[Tje2]T1,T2=E[T1T2](1)

(2)E[Oui2]=E[{E(Oui|X)}2]+E[(Oui-E[Oui|X])2],
E[T1T2]=Cov(T1,T2)=0(2)
  1. Soustrayez des deux côtés, en faisant le côté gauche ,(E[Oui])2Var[Oui]

  2. Notant à droite que ,E[{E(Oui|X)}2]-(E[Oui])2=Var(E[Oui|X])

  3. Notant que .E[(Oui-E[Oui|X])2]=E[E{(Oui-E[Oui|X])2}|X]=E[Var(Oui|X)]

Pour plus de détails sur ces trois points, voir le post de @ DilipSarwate. Il explique tout cela plus en détail que moi.

Taylor
la source