Qu'est-ce qu'une estimation impartiale du carré R de la population?

14

Je souhaite obtenir une estimation non biaisée de R2 dans une régression linéaire multiple.

À la réflexion, je peux penser à deux valeurs différentes qu'une estimation non biaisée de pourrait essayer de faire correspondre.R2

  1. Hors échantillon :R2 le carré r qui serait obtenu si l'équation de régression obtenue à partir de l'échantillon (c'est-à-dire ) était appliquée à une quantité infinie de données externes à l'échantillon mais à partir des mêmes données processus de génération.β^
  2. Population :R2 Le carré r qui serait obtenu si un échantillon infini était obtenu et le modèle ajusté à cet échantillon infini (c.-à-d. ) ou alternativement juste le carré R impliqué par le processus de génération de données connu.β

Je comprends que ajustéR2 est conçu pour compenser le sur-ajustement observé dans l'échantillon . Néanmoins, il n'est pas clair si ajusté est réellement une estimation sans biais de , et s'il s'agit d'une estimation sans biais, laquelle des deux définitions de ci-dessus il vise à estimer.R2R2R2R2

Ainsi, mes questions:

  • Qu'est-ce qu'une estimation impartiale de ce que j'appelle ci-dessus sur l'échantillon R2 ?
  • Qu'est-ce qu'une estimation impartiale de ce que j'appelle au-dessus de la population ?R2
  • Y a-t-il des références qui fournissent une simulation ou une autre preuve de l'impartialité?
Jeromy Anglim
la source
La question de savoir quelle formule pour adj. R ^ 2 est moins biaisé a été relevé par exemple ici .
ttnphns
Merci. Je lis maintenant la référence que vous mentionnez: Yin, P., & Fan, X. (2001). Estimation du retrait en régression multiple: comparaison de différentes méthodes analytiques. The Journal of Experimental Education, 69 (2), 203-224. R2
Jeromy Anglim

Réponses:

14

Évaluation des ajustements analytiques au carré R

R2

  • ρ2
  • ρc2

Leurs résultats sont résumés dans l'abstrait:

R2ρ2ρ2ρc2

ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

où N est la taille de l'échantillon et p est le nombre de prédicteurs.

Estimations empiriques des ajustements du carré R

R2ρ2ρc2ρ2

Les références

  • Kromrey, JD et Hines, CV (1995). Utilisation d'estimations empiriques du retrait dans les régressions multiples: une mise en garde. Mesures éducatives et psychologiques, 55 (6), 901-925.
  • R2
Jeromy Anglim
la source