Quelle est la différence entre l' endogénéité et l'hétérogénéité non observée? Je sais que l'endogénéité vient par exemple de variables omises? Mais d'après ce que je comprends, l'hétérogénéité non observée cause le même problème. Mais où se situe exactement la différence entre ces deux notions?
regression
assumptions
MarkDollar
la source
la source
Réponses:
Les termes endogénéité et hétérogénéité non observée se réfèrent souvent à la même chose mais leur utilisation varie quelque peu, même au sein de l'économie, la discipline que j'associe le plus aux termes.
Dans une équation de régression, une variable explicative est endogène si elle est corrélée avec le terme d'erreur.
L'endogénéité est souvent décrite comme ayant trois sources: les variables omises, l'erreur de mesure et la simultanéité. Bien qu'il soit souvent utile de mentionner ces «sources» séparément, une confusion survient parfois parce qu'elles ne sont pas vraiment distinctes. Imaginez une régression prédisant l'effet de l'éducation sur les salaires. Peut-être que notre mesure de l'éducation est simplement le nombre d'années qu'une personne a passées dans l'enseignement formel, quel que soit le type d'éducation. Si j'ai une idée claire du type d'éducation qui affecte les salaires, je pourrais décrire cette situation comme une erreur de mesure dans la variable éducation. Alternativement, je pourrais décrire la situation comme un problème de variables omises (les variables indiquant le type d'éducation).
Peut-être que les salaires affectent également les décisions en matière d'éducation. Si les salaires et l'éducation sont mesurés en même temps, c'est un exemple de simultanéité, mais cela aussi pourrait être recadré en termes de variables omises.
L'hétérogénéité non observée est simplement une variation / différence entre les cas qui ne sont pas mesurés. Si vous comprenez l'endogénéité, je pense que vous comprenez les implications de l'hétérogénéité non observée dans un contexte de régression.
la source
Je suis d'accord avec la description de l'endogénéité de @ Michael --- il s'agit d'un problème avec les variables que vous incluez et leur relation avec les variables que vous n'incluez pas (c'est-à-dire les éléments du terme d'erreur).
la source
I understand heterogeneity to be any difference between individuals. Observed heterogeneity usually consists of the covariates and unobserved heterogeneity consists of any unobserved difference like ability or effort.
Endogeneity refers to the relationship between the observed and unobserved variables, namely that they are dependent on one another.
la source
To wrap it up:
la source
the difference between the unobserved heterogeniety and endogeniety in the case of omitted variables lies in the orthogonality assumptions made. Whereas in the former, the assumption is that the unobserved omitted variable is independent of the observed (included) explanatory variable x,...in the latter this assumption is relaxed such that the unobserved (omitted) variable is correlated with some of the observed (included) explanatory variable.
la source
Easy answer, without explanation because it is not wanted: if the omitted variables that cause endogeneity are not observable we call it unobserved heterogeneity. Easy :)
la source