En R, si j'écris
lm(a ~ b + c + b*c)
serait-ce encore une régression linéaire?
Comment faire d'autres types de régression en R? J'apprécierais toute recommandation de manuels ou de tutoriels?
r
regression
suprvisr
la source
la source
lm()
représente une régression linéaire. Votre modèle comprend trois paramètres (moins l'ordonnée à l'origine) pourb
,c
et leur interactionb:c
, qui signifieb + c + b:c
oub*c
pour court (R suit la notation de Wilkinson pour les modèles statistiques). L'ajustement d'un modèle linéaire généralisé (c'est-à-dire lorsque la fonction de lien n'est pas une identité, comme c'est le cas pour le modèle linéaire exprimé ci-dessus) est demandé viaglm()
.Réponses:
Linéaire fait référence à la relation entre les paramètres que vous estimez (par exemple, ) et le résultat (par exemple, ). Par conséquent, est linéaire, mais ne l'est pas. Un modèle linéaire signifie que votre estimation de votre vecteur de paramètres peut être écrite , où les sont des poids déterminés par votre procédure d'estimation. Les modèles linéaires peuvent être résolus algébriquement sous forme fermée, tandis que de nombreux modèles non linéaires doivent être résolus par maximisation numérique à l'aide d'un ordinateur.y i y = e x β + ε y = e β x + ε β = Σ i w i y i { w i }β yi y=exβ+ϵ y=eβx+ϵ β^=∑iwiyi {wi}
la source
Ce message sur minitab.com fournit une explication très claire:
Response = constant + parameter * predictor + ... + parameter * predictor
la source
Je serais prudent en posant cela comme une question de "régression linéaire R" par rapport à une question de "régression linéaire". Les formules dans R ont des règles que vous ne connaissez peut-être pas. Par exemple:
http://wiener.math.csi.cuny.edu/st/stRmanual/ModelFormula.html
En supposant que vous demandez si l'équation suivante est linéaire:
La réponse est oui, si vous assemblez une nouvelle variable indépendante telle que:
La substitution de l'équation newv ci-dessus dans l'équation d'origine ressemble probablement à ce que vous attendez d'une équation linéaire:
En ce qui concerne les références, Google "r régression", ou tout ce que vous pensez pourrait fonctionner pour vous.
la source
a
s'agit d'une fonction linéaire des quatre coefficients.Vous pouvez écrire la régression linéaire sous la forme d'une équation matricielle (linéaire).
ou si vous l'effondrez:
Cette régression linéaire équivaut à trouver la combinaison linéaire des vecteurs , et plus proche du vecteur .c b ∗ c ab c b∗c a
(Ceci a également une interprétation géométrique comme trouvant la projection de sur la portée des vecteurs , et . Pour un problème avec deux vecteurs de colonne avec trois mesures, cela peut toujours être dessiné comme une figure, par exemple, comme indiqué ici: http://www.math.brown.edu/~banchoff/gc/linalg/linalg.html )b c b ∗ ca b c b∗c
La compréhension de ce concept est également importante dans la régression non linéaire. Par exemple, il est beaucoup plus facile de résoudre que car le premier paramétrage permet de résoudre les et des coefficients avec les techniques de régression linéaire. y = u ( e c ( t - v ) + e d ( t - v ) ) a by=aect+bedt y=u(ec(t−v)+ed(t−v)) a b
la source