Dans la méthode des moindres carrés, nous voulons estimer les paramètres inconnus dans le modèle:
Une fois que nous avons fait cela (pour certaines valeurs observées), nous obtenons la droite de régression ajustée:
Maintenant, évidemment, nous voulons vérifier certaines parcelles pour nous assurer que les hypothèses sont remplies. Supposons que vous vouliez vérifier l'homoscédasticité, cependant, pour ce faire, nous vérifions en fait les résidus . Supposons que vous examiniez le tracé des valeurs résiduelles et des valeurs prédites, si cela nous montre qu'une hétéroscédasticité est apparente, alors comment cela est-il lié au terme de perturbation ? L'hétéroscédasticité dans les résidus implique-t-elle une hétéroscédasticité en termes de perturbation?
La relation entre et est:ε^ ε
où , la matrice de chapeau, est .H X(XTX)−1XT
Ce qui revient à dire que est une combinaison linéaire de toutes les erreurs, mais généralement la majeure partie du poids tombe sur la ème.ε^i i
Voici un exemple, en utilisant l'
cars
ensemble de données dans R. Considérez le point marqué en violet:Appelons cela le point . Le résidu, , où le pour les autres erreurs est de l'ordre de -0,02:i ε^i≈0.98εi+∑j≠iwjεj wj
Nous pouvons réécrire cela comme:
ou plus généralement
où est le - ième élément diagonal de . De même, les ci-dessus sont .hii i H wj hij
Si les erreurs sont iid alors dans cet exemple, la somme pondérée de ces autres erreurs aura un écart-type correspondant à environ 1 / 7ème de l'effet de l'erreur de la ème observation sur son résiduel .N(0,σ2) i
C'est-à-dire que dans les régressions bien comportées, les résidus peuvent généralement être traités comme une estimation modérément bruyante du terme d'erreur non observable. Lorsque nous considérons des points plus éloignés du centre, les choses fonctionnent un peu moins bien (le résidu devient moins pondéré sur l'erreur et les pondérations sur les autres erreurs deviennent moins égales).
Avec de nombreux paramètres, ou avec des pas si bien distribués, les résidus peuvent être beaucoup moins semblables aux erreurs. Vous voudrez peut-être essayer quelques exemples.X
la source