Considérez le modèle linéaire simple:
où et , et contient une colonne des constantes.
Ma question est, étant donné , et , existe-t-il une formule pour une borne supérieure non triviale sur *? (en supposant que le modèle a été estimé par OLS).
* J'ai supposé, en écrivant ceci, qu'obtenir lui-même ne serait pas possible.
EDIT1
en utilisant la solution dérivée de Stéphane Laurent (voir ci-dessous) nous pouvons obtenir une borne supérieure non triviale sur . Certaines simulations numériques (ci-dessous) montrent que cette limite est en fait assez serrée.
Stéphane Laurent a dérivé ce qui suit: où est une distribution bêta non centrale avec paramètre de non-centralité avec
Donc
où est un non central avec le paramètre et degrés de liberté. Donc, une borne supérieure non triviale pour \ mathrm {E} (R ^ 2) estχ 2 λ k E ( R 2 )
il est très serré (beaucoup plus serré que ce à quoi je m'attendais serait possible):
par exemple, en utilisant:
rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)
la moyenne des simulations sur 1000 est . La borne supérieure théorique ci-dessus donne . La borne semble être également précise sur de nombreuses valeurs de . Vraiment étonnant!R 20.960819
0.9609081
EDIT2:
après de plus amples recherches, il semble que la qualité de l'approximation de la borne supérieure de s'améliorera à mesure que augmentera (et toutes choses égales par ailleurs, augmentera avec ).λ + p λ n
la source
Réponses:
Tout modèle linéaire peut s'écrire où G a la distribution normale standard sur R n et μ est supposé appartenir à un sous-espace linéaire W de R n . Dans votre cas, W = Im ( X ) .Y=μ+σG G Rn μ W Rn W=Im(X)
Soit le sous-espace linéaire unidimensionnel généré par le vecteur ( 1 , 1 , … , 1 ) . En prenant U = [ 1 ] ci-dessous, le R 2 est fortement lié à la statistique de Fisher classique F = ‖ P Z Y ‖ 2 / ( m - ℓ )[1]⊂W (1,1,…,1) U=[1] R2
pour le test d'hypothèse deH0:{μ∈U}oùU⊂West un sous-espace linéaire, et désignant par Z=U⊥∩Wle complément orthogonal deUenW, et désignantm=dim(W)etℓ=dim(U)
En effet, car la définition deR2est R2= ‖ P Z Y ‖ 2
De toute évidence , et P ⊥ W Y = σ P ⊥ W G .PZY=PZμ+σPZG P⊥WY=σP⊥WG
Lorsque est vraiH0:{μ∈U} alors et donc
F = ‖ P Z G ‖ 2 / ( m - ℓ )PZμ=0
a ladistribution deFisherFm-ℓ,n-m. Par conséquent, à partir de la relation classique entre la distribution de Fisher et la distribution Bêta,R2∼B(m-ℓ,n-m).
Dans la situation générale, nous devons traiter lorsque P Z μ ≠ 0 . Dans ce cas général, on a ‖ P Z Y ‖ 2 ∼ σ 2 χ 2 m - ℓ ( λ ) , la distribution non centrale χ 2 avec m - ℓ degrés de liberté et le paramètre de non-centralité λ = ‖PZY=PZμ+σPZG PZμ≠0 ∥PZY∥2∼σ2χ2m−ℓ(λ) χ2 m−ℓ , puis
F∼Fm-ℓ,n-m(λ)(distribution de Fisher non centrale). Il s'agit du résultat classique utilisé pour calculer la puissance destestsF.λ=∥PZμ∥2σ2 F∼Fm−ℓ,n−m(λ) F
La relation classique entre la distribution de Fisher et la distribution de Beta tient également dans la situation non centrale. Enfin a la distribution bêta non centrale avec les "paramètres de forme" m - ℓ et n - m et le paramètre de non-centralité λ . Je pense que les moments sont disponibles dans la littérature mais ils sont peut-être très compliqués.R2 m−ℓ n−m λ
Notons enfin . Notez que P Z = P W - P U . On a P U μ = ˉ μ 1 lorsque U = [ 1 ] , et P W μ = μ . D'où P Z μ = μ - ˉ μ 1 où ici μ = X β pour le vecteur de paramètres inconnus β .PZμ PZ=PW−PU PUμ=μ¯1 U=[1] PWμ=μ PZμ=μ−μ¯1 μ=Xβ β
la source