Une erreur standard est l'écart - type estimé σ ( θ ) d'un estimateur θ pour un paramètre .
Pourquoi l'écart-type estimé des résidus est-il appelé "erreur-type résiduelle" (par exemple, dans la sortie de la summary.lm
fonction de R ) et non "écart-type résiduel"? Quelle estimation de paramètre équipons-nous ici d'une erreur standard?
Considérons-nous chaque résidu comme un estimateur de "son" terme d'erreur et estimons-nous l'erreur-type "regroupée" de tous ces estimateurs?
r
standard-error
residuals
terminology
Michael M
la source
la source
Réponses:
Je pense que la formulation est spécifique aux R
summary.lm()
sortieNotez que la valeur sous-jacente est en fait appelée "sigma" (summary.lm()$sigma
). Je ne pense pas que d'autres logiciels utilisent nécessairement ce nom pour l'écart-type des résidus. De plus, l'expression «écart-type résiduel» est courante dans les manuels, par exemple. Je ne sais pas comment cela est devenu le phrasé utilisé dans lasummary.lm()
sortie de R , mais j'ai toujours pensé que c'était bizarre.la source
summary.lm(reg)$sigma
différent desd(reg$residuals)
?stats::sigma
: Le terme impropre «Erreur standard résiduelle» fait partie de trop de sorties R (et S) pour y être facilement modifié.D'après ma formation en économétrie, cela s'appelle "erreur standard résiduelle" car c'est une estimation de l '"écart type résiduel" réel. Voir cette question connexe qui corrobore cette terminologie.
Une recherche Google pour le terme erreur standard résiduelle montre également beaucoup de hits, donc ce n'est en aucun cas une bizarrerie. J'ai essayé les deux termes avec des guillemets, et les deux apparaissent environ 60 000 fois.
la source
Erreur standard - Wikipedia, l'encyclopédie gratuite
la source
Un modèle de régression ajusté utilise les paramètres pour générer des prévisions d'estimation ponctuelles qui sont les moyens des réponses observées si vous deviez reproduire l'étude avec les mêmes valeurs XX un nombre infini de fois ( lorsque le modèle linéaire est vrai ).
La différence entre ces valeurs prédites et celles utilisées pour ajuster le modèle est appelée " résiduels " qui, lors de la réplication du processus de collecte de données, ont des propriétés de variables aléatoires avec 0 moyenne. Les résidus observés sont ensuite utilisés pour estimer ultérieurement la variabilité de ces valeurs et pour estimer la distribution d'échantillonnage des paramètres.
Remarque:
Lorsque l'erreur standard résiduelle est exactement 0, le modèle ajuste parfaitement les données (probablement en raison d'un surajustement).
Si l'erreur standard résiduelle ne peut pas être montrée comme étant significativement différente de la variabilité de la réponse inconditionnelle, alors il y a peu de preuves pour suggérer que le modèle linéaire a une quelconque capacité prédictive.
la source