J'ajuste une régression sur le . Est-il valable de sauvegarder les estimations des points de transformation (et les intervalles de confiance / prédiction) par exponentiation? Je ne le crois pas, puisque mais voulait les opinions des autres.
Mon exemple ci-dessous montre des conflits avec la transformation arrière (.239 vs .219).
set.seed(123)
a=-5
b=2
x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)
### NLS Fit
f <- function(x,a,b) {exp(a*x+b)}
fit <- nls(y ~ exp(a*x+b), start = c(a=-10, b=15))
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2)
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773
### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
fit lwr upr
1 0.2199471 0.1492762 0.3240752
Réponses:
Cela dépend de ce que vous voulez obtenir à l'autre bout.
Un intervalle de confiance pour un paramètre transformé se transforme très bien. S'il a la couverture nominale sur l'échelle logarithmique, il aura la même couverture sur l'échelle d'origine, en raison de la monotonie de la transformation.
Un intervalle de prédiction pour une observation future se transforme également très bien.
Un intervalle pour une moyenne sur l'échelle logarithmique ne sera généralement pas un intervalle approprié pour la moyenne sur l'échelle d'origine.
Cependant, parfois, vous pouvez produire exactement ou approximativement une estimation raisonnable de la moyenne sur l'échelle d'origine à partir du modèle sur l'échelle logarithmique.
Cependant, des précautions sont nécessaires ou vous pourriez finir par produire des estimations qui ont des propriétés quelque peu surprenantes (il est possible de produire des estimations qui n'ont pas de moyenne de population par exemple; ce n'est pas l'idée de tout le monde d'une bonne chose).
Ainsi, par exemple, dans le cas lognormal, lorsque vous exponentiarisez, vous avez une belle estimation de , et vous remarquerez peut-être que la moyenne de la population est , vous pouvez donc penser à améliorer en le à l'échelle par une estimation de .exp(μi) exp(μi+12σ2) exp(μi^) exp(12σ2)
On devrait au moins être en mesure d'obtenir une estimation cohérente et, en fait, certaines asymptotiques de distribution via le théorème de Slutsky (en particulier la forme du produit) tant que l'on peut constamment estimer l'ajustement. Le théorème de la cartographie continue dit que vous pouvez si vous pouvez estimer cohérente ... ce qui est le cas.σ2
Donc tant que est un estimateur cohérent de , alors converge en distribution vers la distribution de (qui par inspection sera alors asymptotiquement répartie lognormalement ). Puisque sera cohérent pour , mais le théorème de la cartographie continue, sera cohérent pour , et nous avons donc un estimateur cohérent de la moyenne sur l'échelle d'origine.σ^2 σ2 exp(μi^)⋅exp(12σ^2) exp(μi^)⋅exp(12σ2) μi^ μi exp(μi^) exp(μi)
Voyez ici .
Quelques articles liés:
Transformation arrière d'un modèle MLR
Transformation arrière
Intervalles de confiance rétrotransformés
la source