Pourquoi la régression polynomiale est-elle considérée comme un cas particulier de régression linéaire multiple?

38

Si la régression polynomiale modélise les relations non linéaires, comment peut-elle être considérée comme un cas particulier de régression linéaire multiple?

Wikipedia note que "Bien que la régression polynomiale adapte un modèle non linéaire aux données, elle est linéaire en tant que problème d’estimation statistique, en ce sens que la fonction de régression est linéaire dans les paramètres inconnus estimés. à partir des données. "E(y|X)

Comment la régression polynomiale est-elle linéaire dans les paramètres inconnus si les paramètres sont des coefficients pour les termes de commande 2?

gavinmh
la source
4
Les paramètres à estimer sont (multi) linéaires. Si vous estimiez les valeurs des exposants, le problème d’estimation ne serait pas linéaire; mais la quadrature d'un prédicteur fixe l'exposant exactement à 2.
Sycorax dit Réintégrer Monica
D'après ce que je comprends, le commentaire de @ user777, ainsi que les réponses ci-dessous, s'appliquent non seulement à la régression polynomiale, mais également à toute régression qui utilise une bijection des variables prédictives. par exemple, toute fonction réversible, telle que , , etc. (plus quelques autres fonctions, évidemment, puisque les deuxièmes puissances ne sont pas bijectives). e xlog(X)eX
naught101
Merci tout le monde; toutes les réponses et commentaires ont été utiles.
gavinmh

Réponses:

53

Lors du montage d' un modèle de régression tel que y i = β 0 + β 1 x i + ß 2 x , le modèle et les OLS estimateur ne pas « savoir » quex 2 i est simplement le carré dexi, ça "pense" que c'est une autre variable. Bien sûr, il existe une certaine colinéarité, qui est incorporée dans l’ajustement (par exemple, les erreurs types sont plus grandes qu’elles ne le seraient autrement), mais de nombreuses paires de variables peuvent être quelque peu colinéaires sans que l’une ne soit fonction de l’autre. y^je=β^0+β^1Xje+β^2Xje2Xje2Xje

Nous ne reconnaissons pas qu'il existe réellement deux variables distinctes dans le modèle, car nous savons que est finalement la même variable que x i que nous avons transformée et incluse afin de capturer une relation curviligne entre x i et y i . Cette connaissance de la vraie nature de x 2 i , associée à notre conviction qu'il existe une relation curviligne entre x i et y i, nous empêche de comprendre en quoi elle est toujours linéaire du point de vue du modèle. De plus, on visualise xXje2XjeXjeyjeXje2Xjeyje et x 2 i ensemble en regardant la projection marginale de la fonction 3D sur le plan 2D x , y . XjeXje2X,y

Si vous ne disposez que de et x 2 i , vous pouvez essayer de les visualiser dans tout l'espace 3D (bien qu'il soit encore difficile de voir vraiment ce qui se passe). Si vous examiniez la fonction ajustée dans l'espace 3D complet, vous verriez que la fonction ajustée est un plan 2D et, en outre, qu'il s'agit d'un plan plat. Comme je l'ai dit, il est difficile de bien voir parce que les données x i , x 2 i n'existent que le long d'une ligne courbe qui traverse cet espace 3D (ce fait est la manifestation visuelle de leur colinéarité). Nous pouvons essayer de le faire ici. Imaginez que ce soit le modèle ajusté: XjeXje2Xje,Xje2

x     = seq(from=0, to=10, by=.5)
x2    = x**2
y     = 3 + x - .05*x2
d.mat = data.frame(X1=x, X2=x2, Y=y)

# 2D plot
plot(x, y, pch=1, ylim=c(0,11), col="red", 
     main="Marginal projection onto the 2D X,Y plane")
lines(x, y, col="lightblue")

entrez la description de l'image ici

# 3D plot
library(scatterplot3d)
s = scatterplot3d(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, color="gray", pch=1, 
              xlab="X1", ylab="X2", zlab="Y", xlim=c(0, 11), ylim=c(0,101), 
              zlim=c(0, 11), type="h", main="In pseudo-3D space")
s$points(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, col="red", pch=1)
s$plane3d(Intercept=3, x.coef=1, y.coef=-.05, col="lightblue")

entrez la description de l'image ici

Il peut être plus facile de voir dans ces images, qui sont des captures d'écran d'une figure 3D pivotée réalisée avec les mêmes données à l'aide du rglpackage.

entrez la description de l'image ici

ppp+1

gung - Rétablir Monica
la source
17

y=une+bX+cX2Xunebcy=Σje=0Nunejehje(X)hjeXhjeX

reine des abeilles
la source
14

yje=b0+b1Xjen1++bpXjenp+εje.

y=Xb+ε;X=(1X1n1X1np1X2n1X2np1Xnn1Xnnp).
mookid
la source