La référence pour la somme et la différence des variables hautement corrélées étant presque non corrélée

11

Dans un article que j'ai écrit, je modélise les variables aléatoires et plutôt que et pour éliminer efficacement les problèmes qui surviennent lorsque et sont fortement corrélés et ont une variance égale (comme ils le sont dans mon application). Les arbitres veulent que je donne une référence. Je pourrais facilement le prouver, mais étant un journal d'application, ils préfèrent une référence à une dérivation mathématique simple.X+YXYXYXY

Quelqu'un a-t-il des suggestions pour une référence appropriée? Je pensais qu'il y avait quelque chose dans le livre EDA de Tukey (1977) sur les sommes et les différences mais je ne le trouve pas.

Rob Hyndman
la source
Wikipédia fait référence à un manuel sur en.wikipedia.org/wiki/… ; pas sûr que ça aide ...
shabbychef
4
Et la preuve est en effet plus que triviale avec des variances égales :( ... Bonne chance, Rob.Cov(X+Y,XY)=E((XμX)+(YμY))((XμX)(YμY))=VarXVarY=0
Dmitrij Celov
2
Tukey ne prouve rien dans l'EDA: il procède par l'exemple. Pour un exemple de comparaison entre et voir la pièce 3 du chapitre 14, p. 473 (la discussion commence à la p. 470). y+xyx
whuber
1
Une autre façon de se déplacer doit fournir une référence. Vous pouvez considérer qu'il s'agit de modéliser les principales composantes de vos données , plutôt que les variables individuelles elles-mêmes. Ce serait une chose facile de fournir une référence pourX,Y
probabilitéislogic

Réponses:

3

Je me réfère à Seber GAF (1977) Analyse de régression linéaire. Wiley, New York. Théorème 1.4.

Cela dit .cov(AX,BY)=Acov(X,Y)B

Prenez = (1 1) et = (1 -1) et = = vecteur avec vos X et Y.ABXY

Notez que, pour avoir , il est essentiel que X et Y aient les variances similaires. Si , sera grand.cov(X+Y,XY)0var(X)var(Y)cov(X+Y,XY)

Karl
la source
1
Pour que et soient non corrélés (ou presque non corrélés), nous n'avons pas besoin que soit ou presque : nous avons besoin du coefficient de corrélation de Pearson pour être ou presque . WZcov(W,Z)00ρW,Z00
Dilip Sarwate