Intuition (géométrique ou autre) de

8

Dans une autre tranche d'intuitions pour les identités en probabilité, considérons la loi d' identité élémentaire de la variance totale

Var(X)=E[Var(X|Y)]+Var(E[X|Y])

Il s'agit d'une simple manipulation algébrique directe de la définition des moments en sommation, ou, comme dans le lien wikipedia, via la manipulation de E et Var.

Mais cette identité, je n'ai aucune idée de ce qu'elle signifie . Je suppose que cela signifie que vous pourriez vraisemblablement calculer la variance d'une variable en utilisant une autre variable pour vous aider, mais il ne semble pas que cela simplifie les choses ou les rend plus maniables.

La page wiki dit

la première composante est appelée la valeur attendue de la variance du processus (EVPV) et la seconde est appelée la variance des moyennes hypothétiques (VHM)

ce qui est aussi instructif que la lecture des noms peut l'être.

Alors qu'est-ce que cela signifie vraiment ? Y a-t-il une intuition sur les deux parties? Avez-vous besoin d'une intuition de premier? Une intuition géométrique pourrait être agréable, mais aussi une explication verbeuse, une petite algèbre, aiderait énormément.E[E[X|Y]]=E[X]

Existe-t-il de bonnes interprétations de l'algèbre linéaire ou des interprétations physiques ou autres qui donneraient un aperçu de cette identité?

Mitch
la source
4
mais il ne semble pas que cela simplifie ou rend les choses plus maniables - c'est utile dans tous les cas où il y a un auxiliaire qui rend plus facile à penser que juste lui-même. Par exemple, prenez et ; alors Essayer de calculer cela directement aurait été beaucoup moins simple. YXYX XYN(Y,Yσ2)YBinomial(n,p)
E[Var(XY)]=E[Yσ2]=npσ2Var(E[XY])=Var(Y)=np(1p).
Dougal

Réponses:

5

Pour obtenir une intuition simple, nous comparerons avec une analyse bidirectionnelle de la variance. Soit où les sont iid avec une attente nulle et une variance commune , .Yij=μi+ϵijϵijσ2i=1,,k;j=1,,ni

Ensuite, nous avons la décomposition où le premier terme sur la bonne mesure la variance intra-groupe (et peut être utilisé pour estimer la variance intra-groupe commune ), le second terme mesure l'inter-groupe variance, et ne peut être utilisé pour estimer que sous l'hypothèse que tous les ont une valeur commune. Sinon, il contiendra une composante supplémentaire, la "variance des 's". Cela a la même forme comme la loi de la variance totale!

i=1kj=1ni(YijY¯¯)2=i=1kj=1ni(YijYi¯)2+i=1kni((Yi¯Y¯¯)2
σ2σ2μiμi

Formellement, appartenance à un groupe la variable aléatoire . Ensuite, nous obtenons et nous pouvons lire ceci comme "la variance de est la valeur attendue de la variance intra-groupe plus la variance des attentes du groupe." C'est la même chose que notre interprétation de la décomposition de l'ANOVA ci-dessus. En regardant de plus près la dérivation (que nous n'avons pas donnée ici), vous pouvez voir que c'est vraiment une version du théorème de Pythagore. Pour ce point de vue, voir la loi de la variance totale comme théorème de PythagoreG

VarY=EVar(Y|G)+VarE(Y|G)
Y
kjetil b halvorsen
la source
Mon hack mathjax pour obtenir des doubles surlignages ne fonctionne pas très bien. Des idées pour l'améliorer?
kjetil b halvorsen
1
Le surlignage double semble beaucoup mieux avec qu'avec pour une raison quelconque: . XYX¯¯
jbowman