Si nous avons 2 variables aléatoires normales non corrélées nous pouvons créer 2 variables aléatoires corrélées avec la formule
puis aura une corrélation ρ avec X 1 .
Quelqu'un peut-il expliquer d'où vient cette formule?
Si nous avons 2 variables aléatoires normales non corrélées nous pouvons créer 2 variables aléatoires corrélées avec la formule
puis aura une corrélation ρ avec X 1 .
Quelqu'un peut-il expliquer d'où vient cette formule?
Réponses:
Supposons que vous vouliez trouver une combinaison linéaire de et X 2 telle queX1 X2
Notez que si vous multipliez à la fois et β par la même constante (non nulle), la corrélation ne changera pas. Ainsi, nous allons ajouter une condition pour conserver la variance: var ( α X 1 + β X 2 ) = varα β var(αX1+βX2)=var(X1)
Cela équivaut à
Assuming both random variables have the same variance (this is a crucial assumption!) (var(X1)=var(X2) ), we get
There are many solutions to this equation, so it's time to recall variance-preserving condition:
And this leads us to
UPD. Regarding the second question: yes, this is known as whitening.
la source
The equation is a simplified bivariate form of Cholesky decomposition. This simplified equation is sometimes called the Kaiser-Dickman algorithm (Kaiser & Dickman, 1962).
Note thatX1 and X2 must have the same variance for this algorithm to work properly. Also, the algorithm is typically used with normal variables. If X1 or X2 are not normal, Y might not have the same distributional form as X2 .
References:
Kaiser, H. F., & Dickman, K. (1962). Sample and population score matrices and sample correlation matrices from an arbitrary population correlation matrix. Psychometrika, 27(2), 179-182.
la source
Correlation coefficient is thecos between two series if they are treated as vectors (with nth data point being nth dimension of a vector). The above formula simply creates a decomposition of a vector into its cosθ , sinθ components (with respect to X1,X2 ).ρ=cosθ ,
then 1−ρ2−−−−−√=±sinθ .
if
Because ifX1,X2 are uncorrelated, the angle between them is a right angle (ie, they can be considered as orthogonal, albeit non-normalized, basis vectors ).
la source