Corrélation entre X et XY

11

Si j'ai deux variables aléatoires indépendantes X et Y, quelle est la corrélation entre X et le produit XY? Si cela est inconnu, je serais intéressé à savoir au moins ce qui se passe dans le cas spécifique où X et Y sont normaux avec une moyenne nulle, si c'est plus facile à résoudre.

Roberto
la source
4
Qu'est-ce qui motive cette question? Je me demande s'il serait préférable que nous abordions également autre chose ici. Réalisez-vous une étude dans laquelle vous avez créé une variable XY pour une raison quelconque?
gung - Réintégrer Monica

Réponses:

13

Solution

Je suppose que d' une solution valable sera celle qui exprime - si possible - la corrélation en fonction des propriétés distinctes des variables et Y . Le calcul de la corrélation implique le calcul des covariances des monômes en X et Y . Il est économique de faire tout cela en même temps. Observez simplement queXYXY

  1. Lorsque et Y sont indépendants et i et j sont des puissances, alors X i et Y j sont indépendants;XYijXiYj

  2. L'attente d'un produit de variables indépendantes est le produit de leurs attentes.

Cela donnera des formules en fonction des moments de et Y .XY

C'est tout ce qu'on peut en dire.


Détails

Écrivez , etc. pour les moments. Ainsi, pour tout nombre i , j , k , l pour lequel les calculs ont un sens et produisent des nombres finis,μi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Notez que la variance d'une variable aléatoire est sa covariance avec elle-même, nous n'avons donc pas à faire de calcul spécial pour les variances.

Il devrait maintenant être évident comment calculer les moments impliquant des monômes, de toutes puissances, de tout nombre fini de variables aléatoires indépendantes. En tant qu'application, appliquer ce résultat à la définition de la corrélation, qui est la covariance divisée par les racines carrées des variances:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Il existe différentes simplifications algébriques que vous pouvez choisir si vous souhaitez associer cela aux attentes, aux variances et aux covariances des variables d'origine, mais les réaliser ici ne fournirait pas plus d'informations.

whuber
la source
14

Utilisation de la loi de covariance totale et d'indépendance de et Y , Cov ( X , X Y )XY En utilisant la loi de la variance totale, et encore une fois, l'indépendance, Var ( X Y )

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Notez commentYpeut être traité comme une constante dans l'une des attentes, variances ou covariances conditionnelles internes ci-dessus.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Une vérification de ce résultat par simulation:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373
Jarle Tufto
la source
E(Oui2VarX)+Var(OuiEX)ECov(X,XOui|Oui)=EOuiCov(X,X)Ouiest une donnée. Je suggérerais une explication minimale pour certaines des étapes.
Antoni Parellada
1
Oui, j'ai ajouté quelques parenthèses manquantes et quelques explications. Je dois admettre que je préfère la réponse de @whuber.
Jarle Tufto
5

ρ(XOui,X)=0E(X2Oui)=E[E[X2Oui|X]]=E[X2E[Oui|X]]=0. Par conséquentcov(XOui,X)=E(X2Oui)-E(XOui).E(X)=0

Kledou
la source
-2

La corrélation linéaire entre X et XY sera,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Sommation ((X-moyenne (X)) (XY-moyenne (XY)) / n

n - taille de l'échantillon; var (X) = variance de X; var (XY) = variance de XY

Sam Gladio
la source
1
La question concerne les variables aléatoires , pas les données.
whuber
comment savoir si 2 variables aléatoires sont corrélées ou non? Grâce aux données uniquement à droite. Corrige moi si je me trompe. Mes excuses.
Sam Gladio
On calcule théoriquement la corrélation, en utilisant les propriétés mathématiques des variables aléatoires. C'est à peu près la même chose que, disons, calculer la force d'une conception de pont en utilisant les principes de la mécanique newtonienne, par rapport à la construction de ponts et à leur test: il y a des rôles distincts pour la théorie et les données et ils ne doivent pas être confondus les uns avec les autres .
whuber