Endogénéité versus hétérogénéité non observée

13

Quelle est la différence entre l' endogénéité et l'hétérogénéité non observée? Je sais que l'endogénéité vient par exemple de variables omises? Mais d'après ce que je comprends, l'hétérogénéité non observée cause le même problème. Mais où se situe exactement la différence entre ces deux notions?

MarkDollar
la source
une hétérogénéité non observée peut avoir différentes interprétations (google ne donne pas de définition unique par exemple), pouvez-vous citer une référence, ou donner la définition précise que vous souhaitez expliquer.
mpiktas
@mpiktas: J'analyse le problème des variables omises dans une régression. L'omission de variables entraîne des problèmes de cohérence de l'estimateur. Il existe un tas d'autres problèmes qui provoquent des incohérences (causalité simultanée et erreurs de mesure par exemple). Tous ces problèmes sont connus sous le nom d'Endogenity. Mais dans ce contexte, vous entendez souvent le mot hétérogénéité non observée. Et je ne sais pas si c'est un synonyme d'Endogenity? Désolé, je ne peux pas vous donner plus d'informations, car je n'en ai pas (les références sont en polonais, vous ne comprendriez pas :))
MarkDollar
3
essayez-moi, je connais le russe, et les formules sont les mêmes pour toutes les langues.
mpiktas

Réponses:

13

Les termes endogénéité et hétérogénéité non observée se réfèrent souvent à la même chose mais leur utilisation varie quelque peu, même au sein de l'économie, la discipline que j'associe le plus aux termes.

Dans une équation de régression, une variable explicative est endogène si elle est corrélée avec le terme d'erreur.

L'endogénéité est souvent décrite comme ayant trois sources: les variables omises, l'erreur de mesure et la simultanéité. Bien qu'il soit souvent utile de mentionner ces «sources» séparément, une confusion survient parfois parce qu'elles ne sont pas vraiment distinctes. Imaginez une régression prédisant l'effet de l'éducation sur les salaires. Peut-être que notre mesure de l'éducation est simplement le nombre d'années qu'une personne a passées dans l'enseignement formel, quel que soit le type d'éducation. Si j'ai une idée claire du type d'éducation qui affecte les salaires, je pourrais décrire cette situation comme une erreur de mesure dans la variable éducation. Alternativement, je pourrais décrire la situation comme un problème de variables omises (les variables indiquant le type d'éducation).

Peut-être que les salaires affectent également les décisions en matière d'éducation. Si les salaires et l'éducation sont mesurés en même temps, c'est un exemple de simultanéité, mais cela aussi pourrait être recadré en termes de variables omises.

L'hétérogénéité non observée est simplement une variation / différence entre les cas qui ne sont pas mesurés. Si vous comprenez l'endogénéité, je pense que vous comprenez les implications de l'hétérogénéité non observée dans un contexte de régression.

Michael Bishop
la source
1
J'inclurais également l'auto-régression avec des erreurs autocorrélées et la sélection d'échantillons, car de nouvelles façons d'endogénéité peuvent survenir.
Dimitriy V. Masterov
1
@ DimitriyV.Masterov, Merci d'avoir mentionné ces concepts, je pense qu'ils étendent le point que je faisais. Par exemple, un cas donné d'autorégression avec erreurs autocorrélées ou de sélection d'échantillon ne pourrait-il pas être recadré comme un problème de variables omises? Je sais que je ne t'apprends rien. Je veux juste que les apprenants réfléchissent à la façon dont ces termes sont liés et réalisent que le même problème statistique peut être conceptualisé de plusieurs façons.
Michael Bishop
13

Je suis d'accord avec la description de l'endogénéité de @ Michael --- il s'agit d'un problème avec les variables que vous incluez et leur relation avec les variables que vous n'incluez pas (c'est-à-dire les éléments du terme d'erreur).

iβ+biE(bi)=0

yi=xi(β+bi)+wiγ+ϵi,
yixiwixiϵi

yi=xiβ+wiγ+(ϵi+bxi)=xiβ+wiγ+ϵ~i
See that the included variable xi is correlated with the error term ϵ~i, inducing the same problems as the case of endogeneity.
Charlie
la source
3

I understand heterogeneity to be any difference between individuals. Observed heterogeneity usually consists of the covariates and unobserved heterogeneity consists of any unobserved difference like ability or effort.

Endogeneity refers to the relationship between the observed and unobserved variables, namely that they are dependent on one another.

dan
la source
2

To wrap it up:

  • Unobserved heterogeneity is one possible cause of endogeneity.
  • Endogeneity is therefore the broader term.
  • Unobserved heterogeneity implies endogeneity but not the other way around.
petermeissner
la source
2

the difference between the unobserved heterogeniety and endogeniety in the case of omitted variables lies in the orthogonality assumptions made. Whereas in the former, the assumption is that the unobserved omitted variable is independent of the observed (included) explanatory variable x,...in the latter this assumption is relaxed such that the unobserved (omitted) variable is correlated with some of the observed (included) explanatory variable.

jumens
la source
-1

Easy answer, without explanation because it is not wanted: if the omitted variables that cause endogeneity are not observable we call it unobserved heterogeneity. Easy :)

E.Brady
la source