Lorsque vous voulez estimer un modèle simple comme
et au lieu du vrai Y i vous ne l'observez qu'avec une erreur ˜ Y i = Y i + ν i qui est tel qu'il n'est pas corrélé avec X et ϵ , si vous régressez
˜ Y i = α + β X
Ouije= α + βXje+ ϵje
OuijeOui˜je= Yje+ νjeXϵ
votre estimation
β est
βOui˜je= α + βXje+ ϵje
β
car la covariance entre une variable aléatoire et une constante (
α) est nulle ainsi que les covariances entre
Xiβˆ= Co v ( Y˜je, Xje)Va r ( Xje)= Co v ( Yje+ νje, Xje)Va r ( Xje)= Co v ( α + βXje+ ϵje+ νje, Xje)Va r ( Xje)= Co v ( α , Xje)Va r ( Xje)+ βCo v ( Xje, Xje)Va r ( Xje)+ Co v ( ϵje, Xje)Va r ( Xje)+ Co v ( νje, Xje)Va r ( Xje)= βVuner ( Xje)Va r (Xje)= β
αXje et
ϵje, νje puisque nous avons supposé qu'elles n'étaient pas corrélées.
Vous voyez donc que votre coefficient est systématiquement estimé. La seule inquiétude est que vous donne un terme supplémentaire dans l'erreur qui réduit la puissance de vos tests statistiques. Dans de très mauvais cas d'une telle erreur de mesure dans la variable dépendante, il se peut que vous ne trouviez pas d'effet significatif même s'il peut être présent en réalité. Généralement, les variables instrumentales ne vous aideront pas dans ce cas car elles ont tendance à être encore plus imprécises que l'OLS et elles ne peuvent aider qu'avec l'erreur de mesure dans la variable explicative.Oui˜je= Yje+ νje= α + βXje+ ϵje+νje
L'analyse de régression répond à la question "Quelle est la valeur Y MOYENNE pour ceux qui ont donné des valeurs X?" ou, de manière équivalente, "Combien Y devrait-il changer en MOYENNE si nous changeons X d'une unité?" L'erreur de mesure aléatoire ne modifie pas les valeurs moyennes d'une variable ou les valeurs moyennes de sous-ensembles d'individus, de sorte qu'une erreur aléatoire dans la variable dépendante ne biaisera pas les estimations de régression.
Supposons que vous ayez des données de hauteur sur un échantillon d'individus. Ces hauteurs sont mesurées très précisément, reflétant avec précision la vraie stature de chacun. Dans l'échantillon, la moyenne pour les hommes est de 175 cm et la moyenne pour les femmes est de 162 cm. Si vous utilisez la régression pour calculer dans quelle mesure le sexe prédit la taille, vous estimez le modèle
la source