Intuition derrière la formule de la variance d'une somme de deux variables

10

Je sais par des études antérieures que

$Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B)$

Cependant, je ne comprends pas pourquoi. Je peux voir que l'effet sera de «faire monter» la variance lorsque A et B covarient fortement. Il est logique que lorsque vous créez un composite à partir de deux variables hautement corrélées, vous aurez tendance à ajouter les observations élevées de A aux observations élevées de B, et les observations faibles de A aux observations faibles de B. Cela aura tendance à créer des valeurs extrêmement élevées et faibles dans la variable composite, augmentant la variance du composite.

Mais pourquoi fonctionne-t-il pour multiplier la covariance par exactement 2?

variance covariance intuition user1205901 - Réintégrer Monica
la source

1

Si

A

$A$ et

B

$B$ sont parfaitement corrélés positivement, alors

et s'ils sont parfaitement corrélés négativement alors

V a r (A + B) = V a r (A) + V a r (B) + 2 \sqrt{V a r (A) V a r (B)}

$Var(A+B)= Var(A) + Var(B)+ 2\sqrt{ Var(A) Var(B)}$

. La covariance mesure l'étendue de cette relation dans cette plage

V a r (A + B) = V a r (A) + V a r (B) - 2 \sqrt{V a r (A) V a r (B)}

$Var(A+B)= Var(A) + Var(B)- 2\sqrt{ Var(A) Var(B)}$

Henry

21

Réponse simple:

La variance implique un carré:

V une r (X) = E [(X - E [X])^{2}]

$Var(X) = E[(X - E[X])^2]$

Donc, votre question se résume au facteur 2 de l'identité du carré:

(une + b)^{2} = {une}^{2} + b^{2} + 2 une b

$(a+b)^2 = a^2 + b^2 + 2ab$

Ce qui peut être compris visuellement comme une décomposition de l'aire d'un carré de côté en aire des petits carrés des côtés et , en plus de deux rectangles des côtés et : $(a+b)$ $a$ $b$ $a$ $b$

Réponse plus impliquée:

Si vous voulez une réponse mathématiquement plus impliquée, la covariance est une forme bilinéaire, ce qui signifie qu'elle est linéaire dans ses premier et deuxième arguments, cela conduit à:

\begin{aligned} V une r (UNE + B) & = C o v (UNE + B, UNE + B) \\ = C o v (UNE, UNE + B) + C o v (B, UNE + B) \\ = C o v (UNE, UNE) + C o v (UNE, B) + C o v (B, UNE) + C o v (B, B) \\ = V une r (UNE) + 2 C o v (UNE, B) + V une r (B) \end{aligned}

$\begin{aligned} Var(A+B) &= Cov(A+B, A+B) \\ &= Cov(A, A+B) + Cov(B, A+B) \\ &= Cov(A,A) + Cov(A,B) + Cov(B,A) + Cov(B,B) \\ &= Var(A) + 2 Cov(A,B) + Var(B) \end{aligned}$

Dans la dernière ligne, j'ai utilisé le fait que la covariance est symétrique:

C o v (UNE, B) = C o v (B, UNE)

$Cov(A,B) = Cov(B,A)$

Pour résumer:

Il s'agit de deux parce que vous devez prendre en compte à la fois et . $cov(A,B)$ $cov(B,A)$

byouness
la source

5

L'ensemble des variables aléatoires est un espace vectoriel, et de nombreuses propriétés de l'espace euclidien peuvent y être analogues. L'écart type agit un peu comme une longueur et la variance comme une longueur au carré. L'indépendance correspond à une orthogonalité, tandis qu'une parfaite corrélation correspond à une multiplication scalaire. Ainsi, la variance des variables indépendantes suit le théorème de Pythagore:
. $var(A+B) = var(A)+var(B)$

S'ils sont parfaitement corrélés, alors
$std(A+B) = std(A)+std(B)$

Notez que cela équivaut à
$var(A+B) = var(A)+var(B)+2\sqrt{var(A)var(B)}$

S'ils ne sont pas indépendants, ils suivent alors une loi analogue à la loi des cosinus:
$var(A+B) = var(A)+var(B)+2cov(A,B)$

Notez que le cas général se situe entre l'indépendance complète et la corrélation parfaite. Si et sont indépendants, alors est nul. Donc, le cas général est que toujours un terme et un terme , puis il a une certaine variation sur le $A$ $B$ $cov(A,B)$ $var(A,B)$ $var(A)$ $var(B)$ ; plus les variables sont corrélées, plus ce troisième terme sera grand. Et c'est précisément ce queest: c'est $2\sqrt{var(A)var(B)}$ $2cov(A,B)$ fois ledeet. $2\sqrt{var(A)var(B)}$ $r^2$ $A$ $B$

$var(A+B) = var(A)+var(B)+MeasureOfCorrelation*PerfectCorrelationTerm$

$MeasureOfCorrelation = r^2$ $PerfectCorrelationTerm=2\sqrt{var(A)var(B)}$

$r = correl(A,B)$

$\sigma_{A+B} = \sigma_A^2+\sigma_B^2+ 2(r\sigma_A)(r\sigma_B)$

$r^2$ $cos$

Accumulation
la source

2

$Var(A+B)$ $Var$ $Cov$

$A+B$

$A$
$B$
$A$ $B$
$B$ $A$

V une r (UNE + B) = V une r (UNE) + V une r (B) + C o v (UNE, B) + C o v (B, UNE)

$Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)$

= V une r (UNE) + V une r (B) + 2 C o v (UNE, B)

$=Var(A)+Var(B)+2Cov(A,B)$

C o v

$Cov$

Bananin
la source

Intuition derrière la formule de la variance d'une somme de deux variables

Réponses: