J'ai remarqué que l'intervalle de confiance pour les valeurs prédites dans une régression linéaire tend à être étroit autour de la moyenne du prédicteur et de la graisse autour des valeurs minimale et maximale du prédicteur. Ceci peut être vu dans les graphiques de ces 4 régressions linéaires:
Je pensais au départ que c'était parce que la plupart des valeurs des prédicteurs étaient concentrées autour de la moyenne du prédicteur. Cependant, j’ai alors remarqué que le milieu étroit de l’intervalle de confiance se produirait même si de nombreuses valeurs de étaient concentrées autour des extrêmes du prédicteur, comme dans la régression linéaire inférieure gauche, où de nombreuses valeurs du prédicteur sont concentrées autour du minimum de le prédicteur.
Est-ce que quelqu'un peut expliquer pourquoi les intervalles de confiance pour les valeurs prédites dans une régression linéaire ont tendance à être étroits au milieu et gras aux extrêmes?
La réponse acceptée apporte en effet l'intuition nécessaire. Il ne manque que la visualisation de la combinaison des incertitudes linéaires et angulaires, ce qui renvoie très bien aux intrigues de la question. Alors voilà. Appelons
a'
etb'
les incertitudes dea
, etb
, respectivement, les quantités communément renvoyées par n’importe quel logiciel de statistiques populaire. Ensuite, en plus du meilleur ajustementa*x + b
, nous avons quatre lignes possibles à tracer (dans ce cas, 1 covariable x):(a+a')*x + b+b'
(a-a')*x + b-b'
(a+a')*x + b-b'
(a-a')*x + b+b'
Ce sont les quatre lignes collectées dans le graphique ci-dessous. La ligne noire épaisse au milieu représente le meilleur ajustement sans incertitude. Donc, pour dessiner les ombrages "hyperboliques", il faut prendre les valeurs maximales et minimales de ces quatre lignes combinées, qui sont en fait quatre segments de ligne, pas de courbes (je me demande à quel point ces tracés de fence dessinent exactement la courbe, ne semble pas tout précis à moi).
J'espère que cela ajoute quelque chose à la réponse déjà sympathique de @Glen_b.
la source