Considérez la fonction
Cela a été appelé la fonction de régression dans un manuel que j'utilise. J'essaie de comprendre la relation entre cette fonction et le modèle de régression linéaire classique.
Donc, je sais que c'est un théorème * que nous pouvons écrire
pour une variable aléatoire st .
Supposons maintenant que nous ayons
Il s'agit de la fonction de régression unidimensionnelle classique (en supposant que et minimisent la somme résiduelle des carrés).
Question: Est-ce donc un théorème mathématique que si est défini comme ci-dessus, que
Et est- ce pour cela que la fonction est appelée "fonction de régression"?
EDIT: Le théorème que j'utilise est le suivant (extrait de All of Statistics p. 89):
Les modèles de régression sont parfois écrits comme
où . Nous pouvons toujours réécrire un modèle de régression de cette façon. Pour voir cela, définissez et donc . De plus, .
la source
Réponses:
Résumant la question:
Oui, par les propriétés de base de l'attente:
Les raisons historiques pour lesquelles la régression est appelée régression sont liées au fait que Galton a remarqué l'effet de " régression vers la moyenne " - initialement dans une expérience sur des plantes impliquant la taille des graines de la progéniture par rapport à la taille des graines des parents. Une relation à travers la taille moyenne des graines sur les deux variables aura une pente inférieure à (laquelle pente peut être estimée par ce que nous appelons la régression linéaire). Plus la pente est petite, plus l'effet de «régression» est fort. Le problème est illustré par Galton dans le pdf lié par la taille des enfants (en tant qu'adultes) par rapport à la taille moyenne des parents (les femmes étant augmentées d'un facteur constant de pour les rendre comparables aux hommes). Les diagrammes des troisième à cinquième pages indiquent quelque chose de ce qui a été observé.1 8%
Ainsi, une tentative d'estimation de la taille de cette "régression vers la moyenne" est obtenue par ce que l'on a appelé la régression linéaire. Bien sûr, il n'y a rien de spécial - la régression vers la moyenne n'est pas une "poussée vers la médiocrité" biologique comme on aurait pu le supposer à l'origine, mais une conséquence assez simple des mathématiques de la situation dans le même sens que les corrélations sont toujours entre et .−1 1
la source