Les estimations de paramètres, comme une moyenne d'échantillon ou un coefficient de régression OLS, sont des statistiques d'échantillon que nous utilisons pour tirer des inférences sur les paramètres de population correspondants. Les paramètres de population sont ce qui nous importe vraiment, mais comme nous n'avons pas accès à l'ensemble de la population (généralement supposée infinie), nous devons plutôt utiliser cette approche. Cependant, il y a certains faits inconfortables qui viennent avec cette approche. Par exemple, si nous prenions un autre échantillon et calculions la statistique pour estimer à nouveau le paramètre, nous trouverions presque certainement qu'il diffère. De plus, aucune de ces estimations ne devrait correspondre tout à fait à la vraie valeur du paramètre que nous voulons connaître. En fait, si nous faisions cela encore et encore, en continuant d'échantillonner et d'estimer pour toujours, on constaterait que la fréquence relative des différentes valeurs estimées suivait une distribution de probabilité. Le théorème de la limite centrale suggère que cette distribution est probablement normale. Nous avons besoin d'un moyen de quantifier le degré d'incertitude dans cette distribution. C'est ce que l'erreur standard fait pour vous.
Dans votre exemple, vous voulez connaître la pente de la relation linéaire entre x1 et y dans la population, mais vous n'avez accès qu'à votre échantillon. Dans votre échantillon, cette pente est de 0,51, mais sans connaître la variabilité de la distribution d'échantillonnage correspondante , il est difficile de savoir quoi faire de ce nombre. L'erreur type, 0,05 dans ce cas, est l'écart type de cette distribution d'échantillonnage. Pour calculer la signification, vous divisez l'estimation par le SE et recherchez le quotient dans le tableau. Ainsi, des SE plus grandes signifient une signification plus faible .
L'écart type résiduel n'a rien à voir avec les distributions d'échantillonnage de vos pentes. Il s'agit simplement de l'écart type de votre échantillon conditionnel à votre modèle. Il n'y a pas de contradiction, il ne pourrait pas y en avoir. Quant à la façon dont vous avez une SD plus grande avec un R ^ 2 élevé et seulement 40 points de données, je suppose que vous avez l'opposé de la restriction de plage - vos valeurs x sont très largement réparties.