Valeur attendue de , le coefficient de détermination, sous l'hypothèse nulle

12

Je suis curieux de la déclaration faite au bas de la première page de ce texte concernant l' ajustementRadjusted2

Radjusted2=1(1R2)(n1nm1).

Le texte dit:

La logique de l'ajustement est la suivante: en régression multiple ordinaire, un prédicteur aléatoire explique en moyenne une proportion 1/(n1) de la variation de la réponse, de sorte que m prédicteurs aléatoires expliquent ensemble, en moyenne, m/(n1) de la variation de la réponse; en d'autres termes, la valeur attendue de R2 est E(R2)=m/(n1) . L'application de la formule [ Radjusted2 ] à cette valeur, où tous les prédicteurs sont aléatoires, donne Radjusted2=0 "

Cela semble être une motivation très simple et interprétable pour Radjusted2 . Cependant, je n'ai pas pu déterminer que E(R2)=1/(n1) pour un seul prédicteur aléatoire (c'est-à-dire non corrélé).

Quelqu'un pourrait-il me diriger dans la bonne direction ici?

gregory_britten
la source
Dans le cas où le lien disparaîtrait à l'avenir, pourriez-vous fournir une référence complète? Je vous remercie.
Richard Hardy

Réponses:

10

Il s'agit de statistiques mathématiques précises. Voir cet article pour la dérivation de la distribution de sous l'hypothèse que tous les régresseurs (sauf le terme constant) ne sont pas corrélés avec la variable dépendante ("prédicteurs aléatoires").R2

Cette distribution est une Bêta, étant le nombre de prédicteurs sans compter le terme constant, et la taille de l'échantillon,mn

R2Beta(m2,nm12)

et donc

E(R2)=m/2(m/2)+[(nm1)/2]=mn1

Cela semble être un moyen intelligent de "justifier" la logique derrière le ajusté : si en effet tous les régresseurs ne sont pas corrélés, alors le ajusté est "en moyenne" nul.R2R2

Alecos Papadopoulos
la source
2
Juste le peu d'informations dont j'avais besoin! Je vous remercie! Et vive Stack Exchange!
gregory_britten
1
Je serais intéressé par le cas où tous les régresseurs ne sont pas corrélés avec la variable dépendante. Auriez-vous une référence à ce sujet?
Olivier
@Olivier Non, j'en ai bien peur. Regardez sous "F-test pour la signification de la régression, la distribution sous l'alternative", ou quelque chose comme ça.
Alecos Papadopoulos