Supposons que j'ai un ensemble de données dans lequel l'incertitude des mesures (qui proviennent de la propagation d'erreurs systématiques de l'appareil de mesure) est différent pour chaque point. Si je fais une régression linéaire sur l'ensemble de données, comment puis-je calculer l'incertitude de la pente? Je voudrais une procédure ou une formule explicite.
linear-model
measurement-error
errors-in-variables
Iván Mauricio Burbano
la source
la source
Réponses:
Nous pouvons modéliser l'expérience comme
Une régression linéaire simple est
Supposons maintenant quev,u ne sont pas corrélés avec x∗,y∗ et mutuellement (une hypothèse assez forte qui peut être améliorée si nous avons plus d'inférences sur la nature des erreurs). Alors notre estimation est
Maintenant, nous pouvons utiliser notreσ^2β~ calculé avec, par exemple, la méthode bootstrap, et le corriger pour β^=β~/λ^ pour que
la source
Je pense que la réponse donnée par @yshilov est vraiment impressionnante en considérant l'erreur de mesure dans le terme d'erreur et de manière significative, déduit le résultat
Pour élaborer, ce bêta a des propriétés spéciales qu'il est un estimateur biaisé, mais biaisé vers 0. Plus précisément, pour la régression linéaire,E(β^1)=β1⋅[σ2x+σxδσ2x+2σxδ+σ2δ]
La preuve est la suivante: en simple régression linéaire, rappel
la source
I have a similar problem - posted here - and no certain answer still. What I did for the moment is simply gather a set of very similar Xs and check if there's a big variation for Y within those lines. Another kind of approach could be some a simulation: you use a single X from your dataset, but replicate the lines following the predictors systematic error (something like rnorm(...,0,0.3)). The confidence interval for slope may be something similar to the systematic error span.
la source
I would recommend a parametric bootstrap on the data. That means generating new datasets that are similar to the real dataset, but are different to the extent implied by your uncertainty in each observation.
Here's some pseudo-code for that. Notice I'm using vector inputs toΔ are standard errors.
rnorm
, as is normal in the R language. Also I'm assuming that what you are callingThen look at the distribution of the values in r.
la source