Je sais par des études antérieures que
Cependant, je ne comprends pas pourquoi. Je peux voir que l'effet sera de «faire monter» la variance lorsque A et B covarient fortement. Il est logique que lorsque vous créez un composite à partir de deux variables hautement corrélées, vous aurez tendance à ajouter les observations élevées de A aux observations élevées de B, et les observations faibles de A aux observations faibles de B. Cela aura tendance à créer des valeurs extrêmement élevées et faibles dans la variable composite, augmentant la variance du composite.
Mais pourquoi fonctionne-t-il pour multiplier la covariance par exactement 2?
variance
covariance
intuition
user1205901 - Réintégrer Monica
la source
la source
Réponses:
Réponse simple:
La variance implique un carré:
Donc, votre question se résume au facteur 2 de l'identité du carré:
Ce qui peut être compris visuellement comme une décomposition de l'aire d'un carré de côté en aire des petits carrés des côtés a et b , en plus de deux rectangles des côtés a et b :( a + b ) une b une b
Réponse plus impliquée:
Si vous voulez une réponse mathématiquement plus impliquée, la covariance est une forme bilinéaire, ce qui signifie qu'elle est linéaire dans ses premier et deuxième arguments, cela conduit à:
Dans la dernière ligne, j'ai utilisé le fait que la covariance est symétrique:
Pour résumer:
Il s'agit de deux parce que vous devez prendre en compte à la fois et c o v ( B , A ) .c o v ( A , B ) c o v ( B , A )
la source
L'ensemble des variables aléatoires est un espace vectoriel, et de nombreuses propriétés de l'espace euclidien peuvent y être analogues. L'écart type agit un peu comme une longueur et la variance comme une longueur au carré. L'indépendance correspond à une orthogonalité, tandis qu'une parfaite corrélation correspond à une multiplication scalaire. Ainsi, la variance des variables indépendantes suit le théorème de Pythagore:v a r ( A + B ) = v a r ( A ) + v a r ( B )
.
S'ils sont parfaitement corrélés, alors
s t d( A + B ) = s t d( A ) + s t d( B )
Notez que cela équivaut à
v a r ( A + B ) = v a r ( A ) + v a r ( B ) + 2 v a r ( A ) v a r ( B )-----------√
S'ils ne sont pas indépendants, ils suivent alors une loi analogue à la loi des cosinus:
v a r ( A + B ) = v a r ( A ) + v a r ( B ) + 2 c o v ( A , B )
Notez que le cas général se situe entre l'indépendance complète et la corrélation parfaite. Si et B sont indépendants, alors c o v ( A , B ) est nul. Donc, le cas général est que v a r ( A , B ) a toujours un terme v a r ( A ) et un terme v a r ( B ) , puis il a une certaine variation sur le 2 √UNE B c o v ( A , B ) v a r ( A , B ) v a r ( A ) v a r ( B ) ; plus les variables sont corrélées, plus ce troisième terme sera grand. Et c'est précisément ce que2cov(A,B)est: c'est2 √2 v a r ( A ) v a r ( B )-----------√ 2 c o v ( A , B ) fois ler2deAetB.2 v a r ( A ) v a r ( B )-----------√ r2 UNE B
la source
la source