La variance d'une somme est-elle égale à la somme des variances?

62

Est-il vrai (toujours) que

Var(i=1mXi)=i=1mVar(Xi)?
Abe
la source
3
Les réponses ci-dessous fournissent la preuve. L'intuition peut être vue dans le cas simple var (x + y): si x et y sont corrélés positivement, les deux auront tendance à être grands / petits ensemble, augmentant ainsi la variation totale. S'ils sont corrélés négativement, ils auront tendance à s'annuler, ce qui réduira la variation totale.
Assad Ebrahim

Réponses:

92

La réponse à votre question est "Parfois, mais pas en général".

Pour voir ceci, prenons des variables aléatoires (avec variances finies). Ensuite,X1,...,Xn

var(i=1nXi)=E([i=1nXi]2)[E(i=1nXi)]2

Notez maintenant que , ce qui est clair si vous Pensez à ce que vous faites lorsque vous calculez à la main. Donc,(i=1nai)2=i=1nj=1naiaj(a1+...+an)(a1+...+an)

E([i=1nXi]2)=E(i=1nj=1nXiXj)=i=1nj=1nE(XiXj)

De même,

[E(i=1nXi)]2=[i=1nE(Xi)]2=i=1nj=1nE(Xi)E(Xj)

alors

var(i=1nXi)=i=1nj=1n(E(XiXj)E(Xi)E(Xj))=i=1nj=1ncov(Xi,Xj)

par la définition de covariance.

Maintenant en ce qui concerne la variance d'une somme égale à la somme des variances? :

  • Si les variables ne sont pas corrélées, oui : c’est-à-dire pour , puiscov(Xi,Xj)=0ij

    var(i=1nXi)=i=1nj=1ncov(Xi,Xj)=i=1ncov(Xi,Xi)=i=1nvar(Xi)
  • Si les variables sont corrélées, non, pas de manière générale : supposons par exemple sont deux variables aléatoires, chacune avec la variance et où . Alors , l'identité échoue donc.X1,X2σ2cov(X1,X2)=ρ0<ρ<σ2var(X1+X2)=2(σ2+ρ)2σ2

  • mais il est possible pour certains exemples : Supposons que aient une matrice de covariance puis( 1 0,4 - 0,6 0,4 1 0,2 - 0,6 0,2 1 ) v a r ( X 1 + X 2 + X 3 ) = 3 = v a r ( X 1 ) + v a r ( X 2 ) + v a r ( X 3 )X1,X2,X3

    (10.40.60.410.20.60.21)
    var(X1+X2+X3)=3=var(X1)+var(X2)+var(X3)

Par conséquent, si les variables ne sont pas corrélées, la variance de la somme est la somme des variances, mais l'inverse n'est pas vrai en général.

Macro
la source
En ce qui concerne la matrice de covariance est-elle correcte? La symétrie entre les triangles supérieur droit et inférieur gauche reflète le fait que , mais la symétrie entre le coin supérieur gauche et le coin inférieur droit (dans ce cas, fait simplement partie de l'exemple, mais peut être remplacé par deux les nombres qui totalisent par exemple, et ? Merci encorecov(Xi,Xj)=cov(Xj,Xi)cov(X1,X2)=cov(X2,X3)=0.30.6cov(X1,X2)=acov(X2,X,3)=0.6a
Abe
42

Var(i=1mXi)=i=1mVar(Xi)+2i<jCov(Xi,Xj).

Donc, si les covariances sont moyennes à , ce qui serait une conséquence si les variables ne sont pas corrélées par paires ou si elles sont indépendantes, la variance de la somme est la somme des variances.0

Un exemple où ce n'est pas vrai: Soit . Soit . Ensuite, .Var(X1)=1X2=X1Var(X1+X2)=Var(2X1)=4

Douglas Zare
la source
Ce sera rarement le cas pour les variances de l'échantillon.
Din
1
@DWin, "rare" est un euphémisme - si les ont une distribution continue, la probabilité que la variance de la somme de l'échantillon soit égale à la somme des variances de l'échantillon dans exactement 0 :)X
Macro
15

Je voulais juste ajouter une version plus succincte de la preuve donnée par Macro, pour que ce soit plus facile de voir ce qui se passe.

Notez que depuisVar(X)=Cov(X,X)

Pour deux variables aléatoires on a:X,Y

Var(X+Y)=Cov(X+Y,X+Y)=E((X+Y)2)E(X+Y)E(X+Y)by expanding,=E(X2)(E(X))2+E(Y2)(E(Y))2+2(E(XY)E(X)E(Y))=Var(X)+Var(Y)+2(E(XY))E(X)E(Y))
Donc, en général, la variance de la somme de deux variables aléatoires n'est pas la somme des variances. Cependant, si sont indépendants, alors , et nous avons .X,YE(XY)=E(X)E(Y)Var(X+Y)=Var(X)+Var(Y)

Notez que nous pouvons produire le résultat pour la somme de variables aléatoires par une simple induction.n

Omar Haque
la source
11

Oui, si chaque paire de n'est pas corrélée, c'est vrai.Xi

Voir l' explication sur Wikipedia

Abe
la source
Je suis d'accord. Vous trouverez également une simple explication sur Insight Things .
Jan Rothkegel