Attente conditionnelle du R au carré

17

Considérez le modèle linéaire simple:

yy=Xββ+ϵ

où et , et contient une colonne des constantes.ϵii.i.d.N(0,σ2)XRn×pp2X

Ma question est, étant donné , et , existe-t-il une formule pour une borne supérieure non triviale sur *? (en supposant que le modèle a été estimé par OLS).E(XX)βσE(R2)

* J'ai supposé, en écrivant ceci, qu'obtenir lui-même ne serait pas possible.E(R2)

EDIT1

en utilisant la solution dérivée de Stéphane Laurent (voir ci-dessous) nous pouvons obtenir une borne supérieure non triviale sur . Certaines simulations numériques (ci-dessous) montrent que cette limite est en fait assez serrée.E(R2)

Stéphane Laurent a dérivé ce qui suit: où est une distribution bêta non centrale avec paramètre de non-centralité avecR2B(p1,np,λ)B(p1,np,λ)λ

λ=||XβE(X)β1n||2σ2

Donc

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

où est un non central avec le paramètre et degrés de liberté. Donc, une borne supérieure non triviale pour \ mathrm {E} (R ^ 2) estχ 2 λ k E ( R 2 )χk2(λ)χ2λkE(R2)

λ+p1λ+n1

il est très serré (beaucoup plus serré que ce à quoi je m'attendais serait possible):

par exemple, en utilisant:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

la moyenne des simulations sur 1000 est . La borne supérieure théorique ci-dessus donne . La borne semble être également précise sur de nombreuses valeurs de . Vraiment étonnant!R 2R20.9608190.9609081R2

EDIT2:

après de plus amples recherches, il semble que la qualité de l'approximation de la borne supérieure de s'améliorera à mesure que augmentera (et toutes choses égales par ailleurs, augmentera avec ).λ + p λ nE(R2)λ+pλn

user603
la source
n pR2 a une distribution bêta avec des paramètres dépendant uniquement de et . Non ? np
Stéphane Laurent
1
Oooppss désolé, ma précédente affirmation n'est vraie que sous l'hypothèse du "modèle nul" (interception uniquement). Sinon, la distribution de devrait être quelque chose comme une distribution Beta non centrale, avec un paramètre de non-centralité impliquant les paramètres inconnus. R2
Stéphane Laurent
@ StéphaneLaurent: merci. Souhaitez-vous en savoir plus sur la relation entre les paramètres inconnus et les paramètres de la bêta? Je suis coincé, donc tout pointeur serait le bienvenu ...
user603
Avez-vous absolument besoin de gérer ? Il existe peut-être une formule exacte simple pour . E [ R 2 / ( 1 - R 2 ) ]E[R2]E[R2/(1R2)]
Stéphane Laurent
1
Avec les notations de ma réponse, pour certains k scalaires et le premier moment de la distribution F non centrale est simple. R2/(1R2)=kFkF
Stéphane Laurent

Réponses:

13

Tout modèle linéaire peut s'écrire G a la distribution normale standard sur R n et μ est supposé appartenir à un sous-espace linéaire W de R n . Dans votre cas, W = Im ( X ) .Y=μ+σGGRnμWRnW=Im(X)

Soit le sous-espace linéaire unidimensionnel généré par le vecteur ( 1 , 1 , , 1 ) . En prenant U = [ 1 ] ci-dessous, le R 2 est fortement lié à la statistique de Fisher classique F = P Z Y 2 / ( m - )[1]W(1,1,,1)U=[1]R2 pour le test d'hypothèse deH0:{μU}UWest un sous-espace linéaire, et désignant par Z=UWle complément orthogonal deUenW, et désignantm=dim(W)et=dim(U)

F=PZY2/(m)PWY2/(nm),
H0:{μU}UWZ=UWUWm=dim(W)=dim(U)(alors et = 1 dans votre situation).m=p=1

En effet, car la définition deR2est R2=P Z Y 2

PZY2PWY2=R21R2
R2
R2=PZY2PUY2=1PWY2PUY2.

De toute évidence , et P W Y = σ P W G .PZY=PZμ+σPZGPWY=σPWG

Lorsque est vraiH0:{μU} alors et donc F = P Z G 2 / ( m - )PZμ=0 a ladistribution deFisherFm-,n-m. Par conséquent, à partir de la relation classique entre la distribution de Fisher et la distribution Bêta,R2B(m-,n-m).

F=PZG2/(m)PWG2/(nm)Fm,nm
Fm,nmR2B(m,nm)

Dans la situation générale, nous devons traiter lorsque P Z μ 0 . Dans ce cas général, on a P Z Y 2σ 2 χ 2 m - ( λ ) , la distribution non centrale χ 2 avec m - degrés de liberté et le paramètre de non-centralité λ = PZY=PZμ+σPZGPZμ0PZY2σ2χm2(λ)χ2m , puis FFm-,n-m(λ)(distribution de Fisher non centrale). Il s'agit du résultat classique utilisé pour calculer la puissance destestsF.λ=PZμ2σ2FFm,nm(λ)F

La relation classique entre la distribution de Fisher et la distribution de Beta tient également dans la situation non centrale. Enfin a la distribution bêta non centrale avec les "paramètres de forme" m - et n - m et le paramètre de non-centralité λ . Je pense que les moments sont disponibles dans la littérature mais ils sont peut-être très compliqués.R2mnmλ

Notons enfin . Notez que P Z = P W - P U . On a P U μ = ˉ μ 1 lorsque U = [ 1 ] , et P W μ = μ . D'où P Z μ = μ - ˉ μ 1 où ici μ = X β pour le vecteur de paramètres inconnus β .PZμPZ=PWPUPUμ=μ¯1U=[1]PWμ=μPZμ=μμ¯1μ=Xββ

Stéphane Laurent
la source
1
est la projection orthogoanl de x sur le sousespace linéaire Z . Et P désigne la projection sur l'orthogonale. PZxxZP
Stéphane Laurent
1
Méfiez-vous de . Je vais modifier mon article pour écrire les formules. PxPx2
Stéphane Laurent
1
Done - do you see any simplification ?
Stéphane Laurent
1
μ¯=1nμi
Stéphane Laurent
1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent