Dans une autre tranche d'intuitions pour les identités en probabilité, considérons la loi d' identité élémentaire de la variance totale
Il s'agit d'une simple manipulation algébrique directe de la définition des moments en sommation, ou, comme dans le lien wikipedia, via la manipulation de E et Var.
Mais cette identité, je n'ai aucune idée de ce qu'elle signifie . Je suppose que cela signifie que vous pourriez vraisemblablement calculer la variance d'une variable en utilisant une autre variable pour vous aider, mais il ne semble pas que cela simplifie les choses ou les rend plus maniables.
La page wiki dit
la première composante est appelée la valeur attendue de la variance du processus (EVPV) et la seconde est appelée la variance des moyennes hypothétiques (VHM)
ce qui est aussi instructif que la lecture des noms peut l'être.
Alors qu'est-ce que cela signifie vraiment ? Y a-t-il une intuition sur les deux parties? Avez-vous besoin d'une intuition de premier? Une intuition géométrique pourrait être agréable, mais aussi une explication verbeuse, une petite algèbre, aiderait énormément.
Existe-t-il de bonnes interprétations de l'algèbre linéaire ou des interprétations physiques ou autres qui donneraient un aperçu de cette identité?
Réponses:
Pour obtenir une intuition simple, nous comparerons avec une analyse bidirectionnelle de la variance. Soit où les sont iid avec une attente nulle et une variance commune , .Yij=μi+ϵij ϵij σ2 i=1,…,k;j=1,…,ni
Ensuite, nous avons la décomposition où le premier terme sur la bonne mesure la variance intra-groupe (et peut être utilisé pour estimer la variance intra-groupe commune ), le second terme mesure l'inter-groupe variance, et ne peut être utilisé pour estimer que sous l'hypothèse que tous les ont une valeur commune. Sinon, il contiendra une composante supplémentaire, la "variance des 's". Cela a la même forme comme la loi de la variance totale!
Formellement, appartenance à un groupe la variable aléatoire . Ensuite, nous obtenons et nous pouvons lire ceci comme "la variance de est la valeur attendue de la variance intra-groupe plus la variance des attentes du groupe." C'est la même chose que notre interprétation de la décomposition de l'ANOVA ci-dessus. En regardant de plus près la dérivation (que nous n'avons pas donnée ici), vous pouvez voir que c'est vraiment une version du théorème de Pythagore. Pour ce point de vue, voir la loi de la variance totale comme théorème de PythagoreG
la source