Plage possible de

10

Supposons qu'il existe trois séries chronologiques, , etX1X2Y

Exécution de régression linéaire ordinaire sur ~ ( ), nous obtenons . La régression linéaire ordinaire ~ obtenir . Supposons queYX1Y=bX1+b0+ϵR2=UYX2R2=VU<V

Quelles sont les valeurs minimales et maximales possibles de lors de la régression ~ ( )?R2YX1+X2Y=b1X1+b2X2+b0+ϵ

Je crois que le minimum devrait être + une petite valeur, car l'ajout de nouvelles variables augmente toujours , mais je ne sais pas comment quantifier cette petite valeur, et je ne sais pas comment obtenir la plage maximale .R2VR2

Vendetta
la source

Réponses:

9

1) EDIT: Commentaire du cardinal ci - dessous montre que la bonne réponse à la min question est . Par conséquent, je supprime ma réponse "intéressante", mais finalement incorrecte, à cette partie du message du PO. VR2V

2) Le maximum est 1. Considérons l'exemple suivant, qui correspond à votre cas.R2

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

Ici, nous fixons la variance de à 0. Cependant, si vous voulez , les choses changent un peu. Vous pouvez obtenir le arbitrairement proche de 1 en plus en plus , mais, comme avec le problème minimum, vous ne pouvez pas y arriver, il n'y a donc pas de maximum. 1 devient le supremum , car il est toujours supérieur à mais c'est aussi la limite comme .ϵσϵ2>0R2σϵ2R2σϵ20

jbowman
la source
2
(+1) Quelques commentaires: C'est une bonne réponse; il est intéressant que vous ayez adopté une approche asymptotique alors qu'il n'est pas clair si le PO était intéressé par cela ou, éventuellement, un fixe- (ou les deux). Cette réponse est un peu incompatible avec la contrainte de l'OP que , cependant, et si ou pour certains , par exemple, alors le minimum pour toutes les tailles d'échantillons fixes sont exactement . (Excusez la pathologie de ces exemples.) De plus, l'OLS n'est pas nécessairement cohérent en l'absence de contraintes supplémentaires sur les prédicteurs. :)nU<VX1=0X1=a1aRR2V:=V(n)
cardinal
@cardinal - en relisant, je ne peux pas comprendre pourquoi j'ai adopté cette approche du problème min, alors que semble maintenant être la réponse manifestement correcte et, comme vous l'avez implicitement observé, j'aurais pu construire un exemple qui le réalise dans la veine de la partie max ... eh bien, peut-être que mon expresso ce matin était accidentellement décaféiné. (Peut-être que je devrais revoir mes réponses plus en profondeur avant de poster aussi!)V
jbowman
Je ne pense pas que vous devriez retirer ce que vous avez écrit, que je l' ai trouver une approche intéressante pour répondre à la question! Alors que les pathologies que je mentionne permettent certainement un minimum de , on peut se demander ce que l'on entend vraiment par . L'autre exemple n'est peut-être pas aussi pathologique car dans une version générale de ce problème, il s'étend au cas où tout supplémentaire se trouve dans l'espace de colonne des autres prédicteurs. :)X 1 = 0 X iR2X1=0Xi
cardinal
1
@cardinal - merci! Je vais le reconstruire, peut-être un peu plus formellement, et le remettre dans le bas dans un moment.
jbowman
5

Soit égale à la corrélation entre X 1 et X 2 , R 1 , Y est égal à la corrélation entre X 1 et Y , et R 2 , Y la corrélation entre X 2 et Y . Puis R 2 pour le modèle complet divisé par V est égalr1,2X1X2r1,YX1Yr2,YX2YR2V

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

Donc, pour le modèle complet est égal à V uniquement si r 1 , 2 = 0 et r 2 1 , Y = U = 0 ouR2Vr1,2=0r1,Y2=U=0

r1,22=2r1,2r1,Yr2,YUV.

Si , R 2 pour le modèle complet est égale à U + V .r1,2=0R2U+V

Margot
la source
(+1) Mignon. Bienvenue sur le site. Veuillez envisager d'enregistrer votre compte afin de pouvoir participer plus pleinement. Je vais devoir regarder cette expression un peu plus loin plus tard. :)
cardinal
4

Sans contraintes sur et V , le minimum est V , puis le maximum est le plus petit min ( V + U , 1 ) . En effet , deux variables peut être parfaitement corrélé (dans ce cas , l' ajout de la deuxième variable ne change pas le R 2 du tout) ou ils pourraient être orthogonales dans ce cas , y compris les résultats en U + V . Il a été souligné à juste titre dans les commentaires que cela nécessite également que chacun soit orthogonal à 1 , le vecteur colonne de 1s.UVVmin(V+U,1)R2U+V1

Vous avez ajouté la contrainte . Cependant, il est toujours possible que U = 0 . Autrement dit, X 1Y , auquel cas min = max = V + 0 . Enfin, il est possible que X 1X 2 donc la borne supérieure soit encore min ( V + U , 1 ) .U<VX1X2U=0X1Ymin=max=V+0X1X2min(V+U,1)

Si vous en saviez plus sur la relation entre et X 2 , je pense que vous pourriez en dire plus.X1X2

Joshua
la source
1
(+1) Mais, notez qu'il n'est pas (tout à fait) vrai que si et X 2 sont orthogonaux, alors leurs valeurs R 2 individuelles seront additionnées en incluant les deux dans le modèle. Nous avons également besoin qu'ils soient orthogonaux au vecteur tout-en-un 1 . Notez que vous pouvez utiliser LX1X2R21 sur ce site pour baliser les mathématiques. :)LATEX
cardinal
C'est vrai. Merci beaucoup pour les commentaires et pour avoir souligné que peut être utilisé. Je pensais que c'était possible, mais j'avais essayé des échappements de style mathjax (et [pour inline / équations. L'écriture comme je le ferais dans TeX fonctionnait comme un charme :)LATEX
Joshua