Contexte
Supposons que nous ayons un modèle des moindres carrés ordinaires où nous avons coefficients dans notre modèle de régression,
où est un vecteur de coefficients, est la matrice de conception définie par
Nous minimisons la somme des erreurs au carré en définissant nos estimations pour à
Un estimateur non biaisé de est où \ mathbf {\ chapeau {y}} \ equiv \ mathbf {X} \ mathbf {\ chapeau {\ beta}} ( réf ).
La covariance de est donnée par
Question
Comment puis-je prouver que pour ,
Mes tentatives
Je sais que pour variables aléatoires échantillonnées à partir de , vous pouvez montrer que en réécrivant le LHS comme et en réalisant que le numérateur est une distribution normale standard, et que le dénominateur est la racine carrée d'une distribution du chi carré avec df = (n-1) et divisé par (n- 1) ( réf ). Et donc il suit une t-distribution avec df = (n-1) ( ref ).
Je n'ai pas pu étendre cette preuve à ma question ...
Des idées? Je suis au courant de cette question , mais ils ne le prouvent pas explicitement, ils donnent juste une règle empirique, en disant "chaque prédicteur vous coûte un degré de liberté".
Réponses:
Depuis nous savons que et ainsi nous savons que pour chaque composant de , où est l' élément diagonal de . Ainsi, nous savons que
Prenez note de l'énoncé du théorème pour la distribution d'une forme quadratique idempotente dans un vecteur normal standard (théorème B.8 de Greene):
Soit le vecteur résiduel de régression et soit qui est la matrice maker résiduelle (ie ) . Il est facile de vérifier que est symétrique et idempotent .ε^
Soit un estimateur pour .
Nous devons ensuite faire de l'algèbre linéaire. Notez ces trois propriétés d'algèbre linéaire:
Donc
Puis
En appliquant le théorème pour la distribution d'une forme quadratique idempotente dans un vecteur normal standard (indiqué ci-dessus), nous savons que .V∼χ2n−p
Puisque vous supposez que est normalement distribué, alors est indépendant de , et puisque est une fonction de , alors est également indépendant de . Ainsi, et sont indépendants l'un de l'autre.ε β^ ε^ s2 ε^ s2 β^ zk V
Ensuite, est le rapport d'une distribution normale standard avec la racine carrée d'une distribution chi carré avec les mêmes degrés de liberté (ie ), qui est une caractérisation de la distribution . Par conséquent, la statistique a une distribution avec degrés de liberté.
Il peut ensuite être manipulé algébriquement sous une forme plus familière.
la source
Theorem for the Distribution of an Idempotent Quadratic Form in a Standard Normal Vector
, n'avons-nous pas aussi besoin que soit symétrique? Malheureusement, je n'ai pas Greene, donc je ne peux pas voir la preuve même si j'ai vu que Wikipedia avait la même forme que vous . Cependant, un contre-exemple semble être la matrice idempotente qui conduit à qui n'est pas Chi-Squared car elle pourrait prendre des valeurs négatives. ..