Pourquoi l'erreur de mesure dans la variable dépendante ne biaise-t-elle pas les résultats?

10

Quand il y a une erreur de mesure dans la variable indépendante, j'ai compris que les résultats seront biaisés contre 0. Lorsque la variable dépendante est mesurée avec erreur, ils disent que cela affecte juste les erreurs standard mais cela n'a pas beaucoup de sens pour moi parce que nous sommes estimer l'effet de X non pas sur la variable d'origine Oui mais sur un autre Oui plus une erreur. Alors, comment cela n'affecte-t-il pas les estimations? Dans ce cas, puis-je également utiliser des variables instrumentales pour supprimer ce problème?

Matou
la source

Réponses:

16

Lorsque vous voulez estimer un modèle simple comme et au lieu du vrai Y i vous ne l'observez qu'avec une erreur ˜ Y i = Y i + ν i qui est tel qu'il n'est pas corrélé avec X et ϵ , si vous régressez ˜ Y i = α + β X

Ouije=α+βXje+ϵje
OuijeOui~je=Ouije+νjeXϵ votre estimation β est β
Oui~je=α+βXje+ϵje
β car la covariance entre une variable aléatoire et une constante (α) est nulle ainsi que les covariances entreXi
β^=Cov(Oui~je,Xje)Vuner(Xje)=Cov(Ouije+νje,Xje)Vuner(Xje)=Cov(α+βXje+ϵje+νje,Xje)Vuner(Xje)=Cov(α,Xje)Vuner(Xje)+βCov(Xje,Xje)Vuner(Xje)+Cov(ϵje,Xje)Vuner(Xje)+Cov(νje,Xje)Vuner(Xje)=βVuner(Xje)Vuner(Xje)=β
αXje et ϵje,νje puisque nous avons supposé qu'elles n'étaient pas corrélées.

Vous voyez donc que votre coefficient est systématiquement estimé. La seule inquiétude est que vous donne un terme supplémentaire dans l'erreur qui réduit la puissance de vos tests statistiques. Dans de très mauvais cas d'une telle erreur de mesure dans la variable dépendante, il se peut que vous ne trouviez pas d'effet significatif même s'il peut être présent en réalité. Généralement, les variables instrumentales ne vous aideront pas dans ce cas car elles ont tendance à être encore plus imprécises que l'OLS et elles ne peuvent aider qu'avec l'erreur de mesure dans la variable explicative.Oui~je=Ouije+νje=α+βXje+ϵje+νje

Andy
la source
J'ai une question simple ici: que se passe-t-il si le νi, qui est l'erreur de mesure dans la variable dépendante, est corrélé avec la variable indépendante d'intérêt? J'imagine qu'il existe de nombreuses possibilités que cela puisse se produire et que le biais de désirabilité sociale peut être un exemple. Si les répondants à l'enquête présentaient un biais de désirabilité sociale lors de la réponse au (x) questionnaire (s) de variable dépendante, et si cette désirabilité était liée à la variable indépendante, disons l'âge ou le sexe (qui pourrait sans doute être lié à la désirabilité sociale), que se passe-t-il dans termes d'endogénéité alors?
Kang Inkyu
3

L'analyse de régression répond à la question "Quelle est la valeur Y MOYENNE pour ceux qui ont donné des valeurs X?" ou, de manière équivalente, "Combien Y devrait-il changer en MOYENNE si nous changeons X d'une unité?" L'erreur de mesure aléatoire ne modifie pas les valeurs moyennes d'une variable ou les valeurs moyennes de sous-ensembles d'individus, de sorte qu'une erreur aléatoire dans la variable dépendante ne biaisera pas les estimations de régression.

Supposons que vous ayez des données de hauteur sur un échantillon d'individus. Ces hauteurs sont mesurées très précisément, reflétant avec précision la vraie stature de chacun. Dans l'échantillon, la moyenne pour les hommes est de 175 cm et la moyenne pour les femmes est de 162 cm. Si vous utilisez la régression pour calculer dans quelle mesure le sexe prédit la taille, vous estimez le modèle

HEjegHT=CONSTUNENT+βgENER+RESjeUUNEL

CONSTUNENTβgENERβgENERgENERβRESjeUUNEL reflète la variance intra-sexe de la taille.)

ββ

βgENERβ sera inférieur à la valeur non biaisée de 13 cm.

gENERβ

user175057
la source