Forme réduite d'un modèle économétrique, problème d'identification et test

7

Vous cherchez de l'aide pour comprendre le problème suivant et comment utiliser la forme réduite en économétrie

Considérons un modèle pour la santé d'un individu:

heunelth=b0+(b1)unege+(b2)wejeght+(b3)hejeght+(b4)munele+(b5)work+(b6)eXercjese+u

supposons que toutes les variables de l'équation à l'exception de l'exercice ne sont pas corrélées avec u.

A) Notez la forme réduite de l'exercice et énoncez les conditions dans lesquelles les paramètres de l'équation sont identifiés.

B) Comment tester l'hypothèse d'identification de la partie c?


Est-il correct de supposer:

eXercjese=b0+(b1)unege+(b2)wejeght+(b3)hejeght+(b4)munele+(b5)work+u
comme forme réduite?

et est la condition pour l'identification des paramètres simplement

E(eXercjese|u)=0

et comment puis-je le tester? Mais en plus à quoi ça sert?

Clemente Cortile
la source

Réponses:

3

C'est la question très standard sur les variables instrumentales des modèles linéaires à équation simple. Compte tenu des primitives de votre question, la seule variable endogène est l' exercice . Pour répondre à cette question particulière, vous avez besoin d'une variable exogène, z , qui remplit deux conditions:

  1. cov (z, u) = 0.
  2. Il doit exister une relation entre la variable endogène et cette variable exogène que vous proposez mais qu'elle ne faisait pas partie du véritable modèle postulé (le modèle structurel). En d'autres termes,
    eXercjese=β0+β1unege+β2wejeght+β3hejeght+β4munele+β5work+ϕz+εeXercjese
    avec ϕ0, E(εeXercjese)=0et orthogonales à toutes vos variables explicatives (autres que l'exercice) et à z.

Avant de poursuivre, une remarque. Par modèle structurel, je veux dire, suivant la convention de Wooldridge et Goldberger, le modèle postulé. Autrement dit, le modèle qui énonce la relation causale entre la santé et vos covariables. Il s'agit d'une différence clé et d'un désaccord avec les réponses précédentes.

Maintenant, de retour au problème, la condition 2 est ce que dans la littérature des équations simultanées appelle l'équation de forme réduite , qui n'est rien d'autre qu'une projection linéaire de l'endogène sur toutes les variables exogènes, y compris z.

Maintenant, branchez le formulaire réduit dans votre modèle postulé et vous obtiendrez

heunelth=α0+α1unege+α2wejeght+α3hejeght+α4munele+α5work+δz+ν
αje=bje+b6βje,je{1,,5}, δ=b6ϕ et ν=u+b6εeXercjese. Par la définition de la projection linéaire,ν n’est pas corrélé avec toutes les variables explicatives et donc l’OLS de cette dernière équation produira des estimations αje et δ, pas le sous-jacent bje dans le vrai modèle.

L'identification nécessite un peu de manipulation sous forme matricielle mais essentiellement elle se réduit à la condition dite de rang . Définirb=(b0,,b6) et X=(1,unege,,eXercjese) de sorte que votre modèle structurel est heunelth=Xb+u. Définissez maintenantz(1,unege,,work,z). Par la condition 1 (cov (z, u) = 0 pour que E (z, u) = 0),

E(zu)=0
Si vous multipliez les côtés bots du modèle structurel par z et prenez vos attentes
E(zX)b=E(zy)
La condition de rang indique que E(zX)est le rang complet de la colonne. Dans cet exemple particulier et compte tenu des conditions sur z, cela équivaut àrunenk(E(zX)=6. Nous avons donc 6 équations dans 6 inconnues. Il existe donc une solution unique pour le système, à savoirb est identifié et est égal à [E(zX)]-1E(zy), comme voulu.

Remarques: La condition 1 est utile pour obtenir la condition de moment mais le modèle de forme réduite avec ϕest crucial pour la condition de rang. Les deux conditions sont habituelles.

À ce stade, il devrait être clair pourquoi avons-nous besoin de cela. D'une part, sans z L'estimateur OLS du vrai modèle produira des estimateurs non cohérents non seulement pourb6 mais pour tous bje. D'un autre côté (et quelque peu liés), nos paramètres sont identifiés de manière unique, nous sommes donc certains d'estimer la véritable relation causale comme indiqué dans notre vrai modèle.

En ce qui concerne les tests, la condition 2 (z et exercice sont partiellement corrélés) peut être testée directement et vous devez toujours signaler cette étape contrairement au commentaire dans une réponse précédente. Il existe une énorme littérature sur cette étape, en particulier la littérature sur les instruments faibles.

La deuxième condition ne peut néanmoins pas être testée directement. Parfois, vous pourriez invoquer la théorie économique pour justifier ou fournir des hypothèses alternatives qui soutiennent l'utilisation de z.

MauOlivares
la source
3

La question n'a pas beaucoup de sens pour moi, comme indiqué. Si le problème indique que l' exercice est endogène (corrélé avec le terme d'erreur), vous ne pouvez pas supposer le contraire dans la solution. De plus, on parle généralement de forme réduite par rapport à la forme structurelle dans le contexte de l'estimation IV. Si l' exercice est endogène, vous avez besoin d'un instrument pour cela (variable qui prédit l'exercice, mais n'affecte pas la santé autrement) pour obtenir des effets causaux. Par exemple, si certaines personnes de votre échantillon ont gagné au hasard des coupons d'adhésion à un gymnase, cela pourrait être un instrument valide.

Des hypothèses d'identification seraient alors

  1. le coupon prédit vraiment l' exercice

  2. le coupon est orthogonal àu

Ce que l'on appelle la forme structurelle serait deux équations, l'une votre modèle d'origine, l'autre régression de l'exercice sur le coupon et d'autres variables explicatives du modèle d'origine (la première étape). La forme réduite serait lorsque vous substituez la première étape à l'équation principale, de sorte que vous régressez la santé en fonction de l' âge, du poids, ..., du travail et du coupon (mais pas d' exercice , car cela a été remplacé). La forme réduite est parfois utilisée pour expliquer les propriétés de l'estimation IV, mais l'AFAIK n'est pas très utilisée dans la pratique.

ivansml
la source