Quelle est l'importance de la matrice chapeau,

10

Quelle est l'importance de la matrice chapeau, $H=X(X^{\prime}X )^{-1}X^{\prime}$ , dans l'analyse de régression?

Est-ce uniquement pour un calcul plus facile?

regression multiple-regression least-squares utilisateur 31466
la source

Pourriez-vous également être plus précis?

Steve S

@SteveS En fait, je veux savoir pourquoi nous avons besoin d'une matrice de chapeau?

utilisateur 31466

Demandez-vous pourquoi nous devons avoir un nom / symbole spécial (c.-à-d. "Matrice de chapeau", " H ") pour la matrice ou demandez-vous plus sur l'importance du produit de matrice du côté droit?

Steve S

14

Dans l'étude de la régression linéaire, le point de départ de base est le processus de génération de données $\textbf{y= XB + u} \quad$ où et déterministe. Après avoir minimisé le critère des moindres carrés, on trouve un estimateur pour , c'est-à-dire . Après avoir branché l'estimateur dans la formule initiale, on obtient comme modèle linéaire du processus de génération de données. Maintenant, on peut remplacer l'estimateur par et obtient $\textbf{u} \sim N(0,\sigma^2 \boldsymbol I)$ $\textbf{X}$ $\widehat {\textbf{B} }$ $\textbf{B}$ $\widehat {\textbf{B}}= ( \textbf{X} ' \textbf{X})^{-1}\textbf{X} '\textbf{y}$ $\widehat {\textbf{y}}=\textbf{X}\widehat {\textbf{B}}$ $\widehat {\textbf{B}}$ $\widehat {\textbf{y}}=\textbf{X}( \textbf{X} ' \textbf{X})^{-1}\textbf{X} '\textbf{y}.$

Ainsi, est en fait une matrice de projection. Imaginez que vous prenez toutes les variables dans . Les variables sont des vecteurs et s'étendent sur un espace. Par conséquent, si vous multipliez par , vous projetez vos valeurs observées dans sur l'espace couvert par les variables dans . Il donne une estimation de et c'est la raison pour laquelle il est appelé matrice chapeau et pourquoi il a une telle importance. Après tout, la régression linéaire n'est rien de plus qu'une projection et avec la matrice de projection, nous ne pouvons pas seulement calculer les estimations pour $\textbf{H} = \textbf{X}( \textbf{X} ' \textbf{X})^{-1}\textbf{X} '$ $\textbf{X}$ $\textbf{H}$ $\textbf{y}$ $\textbf{y}$ $\textbf{X}$ $\textbf{y}$ $\textbf{y}$ mais aussi pour et peut par exemple vérifier s'il est vraiment normalement distribué. $\textbf{u}$

J'ai trouvé cette jolie photo sur internet et elle visualise cette projection. Veuillez noter que est utilisé à la place de . De plus, l'image souligne que le vecteur des termes d'erreur est orthogonal à la projection et n'est donc pas corrélé avec les estimations pour $\beta$ $\textbf{B}$ $\textbf{y}$

entrez la description de l'image ici

type au hasard
la source

5

La matrice de chapeau est très utile pour plusieurs raisons:

Au lieu d'avoir , nous obtenons que où est la matrice chapeau. Cela nous donne que est une cartographie linéaire des valeurs observées. $\widehat{y}=Z\widehat{\beta}$ $\widehat{y}=Py$ $P$ $\widehat{y}$
A partir de la matrice chapeau , il est facile de calculer les résidus . Nous voyons que . $P$ $\widehat{\epsilon}$ $\widehat{\epsilon}=y-\widehat{y}=y-Py=\left(I_n-P\right)y$

wilsnunn
la source

0

Ce n'est rien de plus que de trouver la solution "la plus proche" pour Ax = b où b n'est pas dans l'espace de colonne de A. Nous projetons b sur l'espace de colonne, et résolvons pour Ax (chapeau) = p où p est la projection de b sur espace de colonne.

Andrew W
la source

1

Tout cela peut être fait sans jamais calculer .

H

$H$

whuber

Quelle est l'importance de la matrice chapeau,

Réponses: