Les estimations des coefficients de régression ne sont-elles pas corrélées?

11

Considérons une régression simple (normalité non supposée): e i est avec la moyenne 0 et l'écart type σ . Les estimations des moindres carrés de a et b ne sont-elles pas corrélées?

Yi=a+bXi+ei,
ei0σab
Arnab
la source
2
Qu'est-ce que tu penses? en.wikipedia.org/wiki/Ordinary_least_squares , section "Propriétés des échantillons finis". Cette question a reçu plusieurs réponses sur ce site.
mpiktas

Réponses:

15

a^b^Xi


Xi(1,Xi)2XYiyβ=(a,b)

E(Y)=Xβ

Yiσ2σ>0yY

La solution OLS est

β^=(XX)1Xy,

en supposant que cette matrice inverse existe. Ainsi, en utilisant les propriétés de base de la multiplication matricielle et de la covariance,

Cov(β^)=Cov((XX)1XY)=((XX)1Xσ2X(XX)1)=σ2(XX)1.

(XX)1(a,b)a^b^(XX)1,X1Xi

a^b^Xi

Xib^a^


p+1p1βp+1

XXiii(XX)1ijjiji

β^iβ^j

De nombreux plans expérimentaux standard consistent à choisir les valeurs des variables indépendantes pour rendre les colonnes mutuellement orthogonales. Cela «sépare» les estimations obtenues en garantissant - avant toute collecte de données! - que les estimations ne seront pas corrélées. (Lorsque les réponses ont des distributions normales, cela implique que les estimations seront indépendantes, ce qui simplifie considérablement leur interprétation.)

whuber
la source
XX(XX)1
@Heisenberg C'est un bon point. Je n'étais pas clair à ce sujet. Il n'y a pas d'ambiguïté dans le cas de deux colonnes, mais je dois réfléchir à l'amélioration de la présentation pour le cas de plusieurs colonnes.
whuber
@Heisenberg Je vous remercie pour votre observation perspicace: elle m'a permis de corriger une erreur substantielle dans la discussion du cas de régression multiple.
whuber