Dans un article que j'ai écrit, je modélise les variables aléatoires et plutôt que et pour éliminer efficacement les problèmes qui surviennent lorsque et sont fortement corrélés et ont une variance égale (comme ils le sont dans mon application). Les arbitres veulent que je donne une référence. Je pourrais facilement le prouver, mais étant un journal d'application, ils préfèrent une référence à une dérivation mathématique simple.
Quelqu'un a-t-il des suggestions pour une référence appropriée? Je pensais qu'il y avait quelque chose dans le livre EDA de Tukey (1977) sur les sommes et les différences mais je ne le trouve pas.
correlation
multicollinearity
Rob Hyndman
la source
la source
Réponses:
Je me réfère à Seber GAF (1977) Analyse de régression linéaire. Wiley, New York. Théorème 1.4.
Cela dit .cov(AX,BY)=Acov(X,Y)B′
Prenez = (1 1) et = (1 -1) et = = vecteur avec vos X et Y.A B X Y
Notez que, pour avoir , il est essentiel que X et Y aient les variances similaires. Si , sera grand.cov(X+Y,X−Y)≈0 var(X)≫var(Y) cov(X+Y,X−Y)
la source