Je recherche un algorithme de régression linéaire qui convient le mieux à des données dont la variable indépendante (x) a une erreur de mesure constante et la variable dépendante (y) a une erreur dépendante du signal.
L'image ci-dessus illustre ma question.
Réponses:
Erreur de mesure dans la variable dépendante
Étant donné un modèle linéaire général avec homosckedastic, non autocorrélé et non corrélé avec les variables indépendantes, soit dénote la "vraie" variable, et sa mesure observable. L'erreur de mesure est définie comme leur différence Ainsi, le modèle estimable est: Puisque sont observé, on peut estimer le modèle par OLS. Si l'erreur de mesure en est statistiquement indépendante de chaque variable explicative, alors
un estimateur des moindres carrés pondérés (par exemple Kutner et al. , §11.1; Verbeek , §4.3.1-3);
l'estimateur OLS, qui est toujours sans biais et cohérent, et les erreurs standard cohérentes avec l'hétéroscédasticité, ou simplement les erreurs standard de Wite ( Verbeek , §4.3.4).
Erreur de mesure dans la variable indépendante
Étant donné le même modèle linéaire que ci-dessus, notons la "vraie" valeur et sa mesure observable. L'erreur de mesure est maintenant: Il y a deux situations principales ( Wooldridge , §4.4.2). x k e k = x k - x ∗ kX∗k Xk
x k y x 1 , … , x kCov ( x∗k, ηk) = 0 : l'erreur de mesure n'est pas corrélée avec la variable non observée et doit donc être corrélée avec la mesure observée ; une telle corrélation provoque des prolèmes et la régression OLS de sur donne généralement des estimateurs biaisés et inconsistants.Xk y X1, … , Xk
Autant que je puisse deviner en regardant votre graphique (erreurs centrées sur les "vraies" valeurs de la variable indépendante), le premier scénario pourrait s'appliquer.
la source