Je suis curieux de la déclaration faite au bas de la première page de ce texte concernant l' ajustement
Le texte dit:
La logique de l'ajustement est la suivante: en régression multiple ordinaire, un prédicteur aléatoire explique en moyenne une proportion de la variation de la réponse, de sorte que prédicteurs aléatoires expliquent ensemble, en moyenne, de la variation de la réponse; en d'autres termes, la valeur attendue de est . L'application de la formule [ ] à cette valeur, où tous les prédicteurs sont aléatoires, donne "
Cela semble être une motivation très simple et interprétable pour . Cependant, je n'ai pas pu déterminer que pour un seul prédicteur aléatoire (c'est-à-dire non corrélé).
Quelqu'un pourrait-il me diriger dans la bonne direction ici?
la source
Réponses:
Il s'agit de statistiques mathématiques précises. Voir cet article pour la dérivation de la distribution de sous l'hypothèse que tous les régresseurs (sauf le terme constant) ne sont pas corrélés avec la variable dépendante ("prédicteurs aléatoires").R2
Cette distribution est une Bêta, étant le nombre de prédicteurs sans compter le terme constant, et la taille de l'échantillon,m n
et donc
Cela semble être un moyen intelligent de "justifier" la logique derrière le ajusté : si en effet tous les régresseurs ne sont pas corrélés, alors le ajusté est "en moyenne" nul.R2 R2
la source