La linéarité de la variance

16

Je pense que les deux formules suivantes sont vraies:

Var(aX)=a2Var(X)
tandis que a est un nombre constant si , Y sont indépendants
Var(X+Y)=Var(X)+Var(Y)
XY

Cependant, je ne suis pas sûr de ce qui ne va pas avec ce qui suit:

Var(2X)=Var(X+X)=Var(X)+Var(X)
qui n'est pas égal à 22Var(X) , soit 4Var(X) .

Si on suppose que X est l'échantillon prélevé dans une population, je pense que nous pouvons toujours supposer X pour être indépendant des autres X s.

Alors, quel est le problème avec ma confusion?

lanselibai
la source
8
La variance n'est pas linéaire - votre première affirmation le montre (si c'était le cas, vous auriez Var(aX)=aVar(X) . La covariance d'autre part est bilinéaire.
Batman

Réponses:

33

Le problème avec votre raisonnement est

"Je pense que nous pouvons toujours supposer que est indépendant des autres "XXX

X X X XX n'est pas indépendant de . Le symbole est utilisé ici pour faire référence à la même variable aléatoire. Une fois que vous connaissez la valeur du premier à apparaître dans votre formule, cela corrige également la valeur du second à apparaître. Si vous voulez qu'ils se réfèrent à des variables aléatoires distinctes (et potentiellement indépendantes), vous devez les désigner avec des lettres différentes (par exemple et ) ou en utilisant des indices (par exemple et ); cette dernière est souvent (mais pas toujours) utilisée pour désigner des variables tirées de la même distribution.XXXXY X 1 XXYX1X2

Si deux variables et sont indépendantes alors est le même que : connaître la valeur de ne nous donne pas d'informations supplémentaires sur la valeur de . Mais est si et autrement: connaître la valeur de vous donne des informations sur la valeur de . [Vous pouvez remplacer les probabilités dans ce paragraphe par des fonctions de distribution cumulative, ou, le cas échéant, des fonctions de densité de probabilité, pour essentiellement le même effet.]Y Pr ( X = a | Y = b ) Pr ( X = a ) Y X Pr ( X = a | X = b ) 1 a = b 0 X XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0XX

Une autre façon de voir les choses est que si deux variables sont indépendantes alors elles ont une corrélation nulle (bien que la corrélation nulle n'implique pas l'indépendance !) Mais est parfaitement corrélé avec lui-même, donc ne peut pas être indépendant de lui-même. Notez que puisque la covariance est donnée par , alorsCorr ( X , X ) = 1 X Cov ( X , Y ) = Corr (XCorr(X,X)=1X Cov(X,XCov(X,Y)=Corr(X,Y)Var(X)Var(Y)

Cov(X,X)=1Var(X)2=Var(X)

La formule plus générale de la variance d'une somme de deux variables aléatoires est

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

En particulier, , doncCov(X,X)=Var(X)

Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)

qui est le même que vous auriez déduit de l'application de la règle

Var(aX)=a2Var(X)Var(2X)=4Var(X)

Si vous êtes intéressé par la linéarité, alors vous pourriez être intéressé par la bilinéarité de la covariance. Pour les variables aléatoires , , et (qu'elles soient dépendantes ou indépendantes) et les constantes , , et nous avonsX Y Z a b cWXYZabcd

Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)

Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)

et dans l'ensemble,

Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)

Vous pouvez ensuite l'utiliser pour prouver les résultats (non linéaires) de la variance que vous avez écrits dans votre message:

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

Ce dernier donne, comme cas particulier lorsque ,a=b=1

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

Lorsque et sont pas corrélés (ce qui inclut le cas où ils sont indépendants), cela se réduit à . Donc, si vous voulez manipuler les variances de manière "linéaire" (ce qui est souvent une bonne façon de travailler algébriquement), utilisez plutôt les covariances et exploitez leur bilinéarité.XYVar(X+Y)=Var(X)+Var(Y)

Silverfish
la source
1
Oui! Je pense que vous avez mis en évidence au début que la confusion était essentiellement une notion. Je l'ai trouvé très utile lorsqu'un livre (très explicitement, certains pourraient dire laborieusement) expliquait l'interprétation et les règles d'évaluation d'une déclaration probabiliste (de sorte que, par exemple, même si vous savez ce que vous entendez par où , il est techniquement incorrect si vous envisagez de lancer un dans le craps (et ne donnerait jamais un résultat impair); l'événement serait correctement exprimée en utilisant iid). Pr(X+X=n)XUniform(1..6)nX+X=2XX1,X2
Vandermonde
1
Ceci est en contraste (et je pense que mon erreur aurait pu découlé de) combien 2+PRNG(6)+PRNG(6)souvent est comment vous lancer les dés comme ci - dessus et / ou notation / conventions telles que dans lequel différentes instances sont véritablement destinées à être indépendantes. 2d6=d6+d6
Vandermonde
@Vandermonde C'est un point intéressant. J'ai d'abord envisagé de mentionner l'utilisation d'indices pour faire la distinction entre « différents », mais je n'ai pas pris la peine - je pense que je pourrais le modifier maintenant. L'argument selon lequel «vous n'obtiendriez jamais un score total impair si la somme était » est très clair et convaincant pour quelqu'un qui ne voit pas la nécessité de distinguer: merci de le partager. X2X
Silverfish
0

Une autre façon de penser à ce sujet est que , avec des variables aléatoires .2XX+X

2X signifierait deux fois la valeur des résultats de , alors que signifierait deux essais de . En d'autres termes, c'est la différence entre lancer un dé une fois et doubler le résultat, vs lancer un dé deux fois.XX+XX

Benjamin
la source
+1 C'est une réponse parfaitement claire et correcte. Bienvenue sur notre site!
whuber
Merci @whuber!
Benjamin