Les réponses ci-dessous fournissent la preuve. L'intuition peut être vue dans le cas simple var (x + y): si x et y sont corrélés positivement, les deux auront tendance à être grands / petits ensemble, augmentant ainsi la variation totale. S'ils sont corrélés négativement, ils auront tendance à s'annuler, ce qui réduira la variation totale.
Assad Ebrahim
Réponses:
92
La réponse à votre question est "Parfois, mais pas en général".
Pour voir ceci, prenons des variables aléatoires (avec variances finies). Ensuite,X1,...,Xn
var(∑i=1nXi)=E⎛⎝[∑i=1nXi]2⎞⎠−[E(∑i=1nXi)]2
Notez maintenant que , ce qui est clair si vous Pensez à ce que vous faites lorsque vous calculez à la main. Donc,(∑ni=1ai)2=∑ni=1∑nj=1aiaj(a1+...+an)⋅(a1+...+an)
Si les variables sont corrélées, non, pas de manière générale : supposons par exemple sont deux variables aléatoires, chacune avec la variance et où . Alors , l'identité échoue donc.X1,X2σ2cov(X1,X2)=ρ0<ρ<σ2var(X1+X2)=2(σ2+ρ)≠2σ2
mais il est possible pour certains exemples : Supposons que aient une matrice de covariance puis( 1 0,4 - 0,6 0,4 1 0,2 - 0,6 0,2 1 ) v a r ( X 1 + X 2 + X 3 ) = 3 = v a r ( X 1 ) + v a r ( X 2 ) + v a r ( X 3 )X1,X2,X3
⎛⎝⎜10.4−0.60.410.2−0.60.21⎞⎠⎟
var(X1+X2+X3)=3=var(X1)+var(X2)+var(X3)
Par conséquent, si les variables ne sont pas corrélées, la variance de la somme est la somme des variances, mais l'inverse n'est pas vrai en général.
En ce qui concerne la matrice de covariance est-elle correcte? La symétrie entre les triangles supérieur droit et inférieur gauche reflète le fait que , mais la symétrie entre le coin supérieur gauche et le coin inférieur droit (dans ce cas, fait simplement partie de l'exemple, mais peut être remplacé par deux les nombres qui totalisent par exemple, et ? Merci encorecov(Xi,Xj)=cov(Xj,Xi)cov(X1,X2)=cov(X2,X3)=0.30.6cov(X1,X2)=acov(X2,X,3)=0.6−a
Abe
42
Var(∑i=1mXi)=∑i=1mVar(Xi)+2∑i<jCov(Xi,Xj).
Donc, si les covariances sont moyennes à , ce qui serait une conséquence si les variables ne sont pas corrélées par paires ou si elles sont indépendantes, la variance de la somme est la somme des variances.0
Un exemple où ce n'est pas vrai: Soit . Soit . Ensuite, .Var(X1)=1X2=X1Var(X1+X2)=Var(2X1)=4
Ce sera rarement le cas pour les variances de l'échantillon.
Din
1
@DWin, "rare" est un euphémisme - si les ont une distribution continue, la probabilité que la variance de la somme de l'échantillon soit égale à la somme des variances de l'échantillon dans exactement 0 :)X
Macro
15
Je voulais juste ajouter une version plus succincte de la preuve donnée par Macro, pour que ce soit plus facile de voir ce qui se passe.
Donc, en général, la variance de la somme de deux variables aléatoires n'est pas la somme des variances. Cependant, si sont indépendants, alors , et nous avons .X,YE(XY)=E(X)E(Y)Var(X+Y)=Var(X)+Var(Y)
Notez que nous pouvons produire le résultat pour la somme de variables aléatoires par une simple induction.n
Réponses:
La réponse à votre question est "Parfois, mais pas en général".
Pour voir ceci, prenons des variables aléatoires (avec variances finies). Ensuite,X1,...,Xn
Notez maintenant que , ce qui est clair si vous Pensez à ce que vous faites lorsque vous calculez à la main. Donc,(∑ni=1ai)2=∑ni=1∑nj=1aiaj (a1+...+an)⋅(a1+...+an)
De même,
alors
par la définition de covariance.
Maintenant en ce qui concerne la variance d'une somme égale à la somme des variances? :
Si les variables ne sont pas corrélées, oui : c’est-à-dire pour , puiscov(Xi,Xj)=0 i≠j
Si les variables sont corrélées, non, pas de manière générale : supposons par exemple sont deux variables aléatoires, chacune avec la variance et où . Alors , l'identité échoue donc.X1,X2 σ2 cov(X1,X2)=ρ 0<ρ<σ2 var(X1+X2)=2(σ2+ρ)≠2σ2
mais il est possible pour certains exemples : Supposons que aient une matrice de covariance puis( 1 0,4 - 0,6 0,4 1 0,2 - 0,6 0,2 1 ) v a r ( X 1 + X 2 + X 3 ) = 3 = v a r ( X 1 ) + v a r ( X 2 ) + v a r ( X 3 )X1,X2,X3
Par conséquent, si les variables ne sont pas corrélées, la variance de la somme est la somme des variances, mais l'inverse n'est pas vrai en général.
la source
Donc, si les covariances sont moyennes à , ce qui serait une conséquence si les variables ne sont pas corrélées par paires ou si elles sont indépendantes, la variance de la somme est la somme des variances.0
Un exemple où ce n'est pas vrai: Soit . Soit . Ensuite, .Var(X1)=1 X2=X1 Var(X1+X2)=Var(2X1)=4
la source
Je voulais juste ajouter une version plus succincte de la preuve donnée par Macro, pour que ce soit plus facile de voir ce qui se passe.
Notez que depuisVar(X)=Cov(X,X)
Pour deux variables aléatoires on a:X,Y
Notez que nous pouvons produire le résultat pour la somme de variables aléatoires par une simple induction.n
la source
Oui, si chaque paire de n'est pas corrélée, c'est vrai.Xi
Voir l' explication sur Wikipedia
la source