Je sais que la distribution de la variance de l'échantillon
C'est du fait que peut être exprimée sous forme de matrice,
(où A: symétrique), et elle pourrait être à nouveau exprimée en: (où Q: orthonormé, D: matrice diagonale).
Qu'en est-il de , étant donné l'hypothèse ?
Je figure
Mais je ne sais pas comment le prouver ou le montrer.
Est-il distribué exactement comme ?
Réponses:
Nous pouvons le prouver pour le cas plus général des variables en utilisant la "matrice chapeau" et certaines de ses propriétés utiles. Ces résultats sont généralement beaucoup plus difficiles à énoncer en termes non matriciels en raison de l'utilisation de la décomposition spectrale.p
Maintenant dans la version matricielle des moindres carrés, la matrice chapeau est où a lignes et colonnes (colonne de celles pour ). Supposons que le classement complet des colonnes soit pratique - sinon, vous pouvez remplacer par le classement des colonnes de dans la suite. Nous pouvons écrire les valeurs ajustées comme ou en notation matricielle . En utilisant cela, nous pouvons écrire la somme des carrés comme:H=X(XTX)−1XT X n p+1 β0 p+1 X Y^i=∑nj=1HijYj Y^=HY
Où est une matrice d'identité d'ordre . La dernière étape découle du fait que est une matrice idépotente, carIn n H
Maintenant, une propriété intéressante des matrices idépotentes est que toutes leurs valeurs propres doivent être égales à zéro ou à un. Soit un vecteur propre normalisé de de valeur propre , nous pouvons le prouver comme suit:e H l
(notez que ne peut pas être nul car il doit satisfaire ) Maintenant parce que est idépotent, est aussi, care eTe=1 H In−H
Nous avons également la propriété que la somme des valeurs propres est égale à la trace de la matrice, et
Par conséquent doit avoir valeurs propres égaux à et valeurs propres égal à .I−H n−p−1 1 p+1 0
Maintenant nous pouvons utiliser la décomposition spectrale de où et est orthogonal (car est symétrique). Une autre propriété qui est utile est que . Cela permet de réduire la matriceI−H=ADAT D=(In−p−10[p+1]×[n−p−1]0[n−p−1]×[p+1]0[p+1]×[p+1]) A I−H HX=X A
et nous obtenons:
Maintenant, sous le modèle, nous avons et en utilisant la théorie normale standard, nous avons montrant que les composants de sont indépendants. En utilisant maintenant le résultat utile, nous avons cela pour . La distribution du chi carré avec degrés de liberté pour la somme des erreurs quadratiques suit immédiatement.Y∼N(Xβ,σ2I) ATY∼N(ATXβ,σ2ATA)∼N(ATXβ,σ2I) ATY (ATY)i∼N(0,σ2) i=1,…,n−p−1 n−p−1
la source