Preuve du dernier théorème d'Angrist et Imbens 1994

8

Supposons que nous ayons un instrument binaire qui peut être utilisé pour estimer l'effet de la variable endogène sur le résultat . Supposons que l'instrument ait une première étape importante, qu'il soit assigné au hasard, qu'il satisfasse à la restriction d'exclusion et qu'il satisfasse à la monotonie comme indiqué dans Angrist et Imbens (1994). http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073ZiDiYi

Ils déclarent que la probabilité d'être un compliant ( ) est et la différence dans les résultats potentiels pour la sous-population de complices est Ci

Pr(Ci)=Pr(Di=1|Zi=1)Pr(Di=1Zi=0)
E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)

Quelqu'un peut-il nous éclairer sur la façon dont ils obtiennent ces deux expressions et, surtout, sur la façon dont elles les combinent? J'essaie de comprendre cela à partir de leur article de journal, mais je ne peux pas le comprendre. Toute aide à ce sujet serait très appréciée.

user44903
la source

Réponses:

5

Pour la première partie, vous avez indiqué que vous disposiez d'un instrument «valide». Cela implique pour un traitement binaire et un instrument que est équivalent à , c'est-à-dire que l'instrument a un effet si le traitement est choisi ou non. Cette observation, qui devrait également être énoncée dans l'article d'Angrist et d'Imbens, est essentielle pour le reste de leur preuve. Pour la première étape, ils supposent que , ce qui signifie que le nombre de complices ( est plus grand que celui des défieurs ( ).Cov(Di,Zi)0P(Di=1|Zi=1)P(Di=1|Zi=0)P(Di=1|Zi=1)>P(Di=1|Zi=0)Ci)Fi

En utilisant la restriction d'exclusion (pour chaque { }, nous avons que , c'est-à-dire que l'instrument n'a pas d'effet direct sur le résultat), vous pouvez écrire le différence dans la part des compliants et des défieurs dans la population lorsque où la deuxième étape utilise l'indépendance pour se débarrasser du conditionnement surz0;1Yiz=Yi0z=Yi1z

P(Di=1|Zi=1)P(Di=1|Zi=0)=P(Di1=1|Zi=1)P(Di0=1|Zi=0)=P(Di1=1)P(Di0=0)=[P(Di1=1,Di0=0)+P(Di1=1,Di0=1)][P(Di1=0,Di0=1)+P(Di1=1,Di0=1)]=P(Ci)P(Fi)
Ziparce que les résultats potentiels sont indépendants de l'instrument. La troisième étape utilise la loi de la probabilité totale. Dans la dernière étape, il vous suffit alors d'utiliser la monotonie qui suppose essentiellement que les défieurs n'existent pas, donc et vous obtenez Ce serait votre coefficient de première étape dans une régression 2SLS. L'hypothèse de monotonie est cruciale pour cela et il faut réfléchir sérieusement aux raisons possibles pour lesquelles elle pourrait être violée (cependant, la monotonie peut être assouplie, voir par exemple de Chaisemartin (2012) «Tout ce dont vous avez besoin est TARD» ).P(Fi)=0
P(Ci)=P(Di=1|Zi=1)P(Di=1|Zi=0).

La deuxième partie de la preuve suit un chemin similaire. Pour cela, vous devez vous rappeler que le statut de traitement observé est car vous ne pouvez pas observer les deux résultats potentiels pour la même personne. De cette façon, vous pouvez relier le résultat observé au résultat potentiel, à l'état du traitement et à l'instrument comme Pour la deuxième partie de la preuve, prenez la différence dans le résultat attendu avec l'instrument allumé et allumé, et utilisez la représentation précédente des résultats observés et la restriction d'exclusion dans la première étape pour obtenir:

Di=ZiDi1+(1Zi)Di0
Yi=(1Zi)(1Di)Yi00+Zi(1Di)Yi10+(1Zi)DiYi01+ZiDiYi11
E(Yi|Zi=1)E(Yi|Zi=0)=E(Yi1Di+Yi0(1Di)|Zi=0)E(Yi1Di+Yi0(1Di)|Zi=1)=E(Yi1Di1+Yi0(1Di1)|Zi=1)E(Yi1Di0+Yi0(1Di0)|Zi=0)=E(Yi1Di1+Yi0(1Di1))E(Yi1Di0+Yi0(1Di0))=E((Yi1Yi0)(Di1Di0))=E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)=E(Yi1Yi0|Ci)P(Ci)E(Yi1Yi0|Fi)P(Fi)=E(Yi1Yi0|Ci)P(Ci)

Maintenant, c'était un peu de travail, mais ce n'est pas trop mal si vous connaissez les étapes à suivre. Pour la deuxième ligne, utilisez à nouveau la restriction d'exclusion pour écrire les états de traitement potentiels. Dans la troisième ligne, utilisez l'indépendance pour vous débarrasser du conditionnement sur comme auparavant. À la quatrième ligne, vous factorisez simplement les termes. La cinquième ligne utilise la loi des attentes itérées. La dernière ligne apparaît en raison de l'hypothèse de monotonie, c'est-à-dire . Ensuite, il vous suffit de diviser comme dernière étape et vous arrivez à ZiP(Fi)=0

E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Di=1|Zi=1)P(Di=1|Zi=0)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)
depuis et sont binaires. Cela devrait montrer comment vous combinez les deux preuves et comment elles arrivent à l'expression finale.DiZi
Andy
la source
5

Il existe quatre types de personnes:

  1. Never Takers (NT): pour les deux valeurs de ZD=0
  2. Defiers (DF): lorsque et lorsqueD=0Z=1D=1Z=0
  3. Fournisseurs (C): lorsque et lorsqueD=1Z=1D=0Z=0
  4. Toujours preneurs (AT): pour les valeurs de .D=1Z

La formule de l'estimateur Wald est:

ΔIV=E(Y|Z=1)E(Y|Z=0)Pr(D=1|Z=1)Pr(D=1|Z=0)

En utilisant nos 4 groupes et les règles de probabilité de base, nous pouvons réécrire les deux pièces du numérateur comme: et

E(Y|Z=1)=E(Y1|AT)Pr(AT)+E(Y1|C)Pr(C)+E(Y0|DF)Pr(DF)+E(Y0|NT)Pr(NT)
E(Y|Z=0)=E(Y1|AT)Pr(AT)+E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)+E(Y0|NT)Pr(NT)

Les deux termes du dénominateur sont: et

Pr(D=1|Z=1)=Pr(D=1|Z=1,AT)Pr(AT)+Pr(D=1|Z=1,C)Pr(C)=Pr(AT)+Pr(C)
Pr(D=1|Z=0)=Pr(D=1|Z=0,AT)Pr(AT)+Pr(D=1|Z=0,DF)Pr(DF)=Pr(AT)+Pr(DF)

Le premier correspond à votre première expression.

En revenant à la formule de Wald et en les branchant, nous voyons que certains de ces termes s’annulent dans la soustraction, laissant

ΔIV=[E(Y1|C)Pr(C)+E(Y0|D)Pr(D)][E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)]Pr(C)Pr(DF).
 Cela donne un aperçu. L'estimateur Wald IV est une moyenne pondérée de l'effet du traitement sur les complices et le négatif de l'effet du traitement sur les défieurs.

Nous faisons maintenant deux hypothèses. Tout d'abord, nous supposons la monotonie, de sorte que l'instrument ne peut qu'augmenter ou diminuer la probabilité de participation. Cela signifie que . L'hypothèse de monotonie équivaut à supposer un modèle de fonction d'indice pour le traitement. La deuxième hypothèse est qu'il existe des compliants, c'est-à-dire que . Le comportement de certaines personnes doit être modifié par l'instrument. Cela devrait être le cas si l'instrument est pertinent. Ces deux hypothèses produisentPr(DF)=0Pr(C)>0

ΔIV=E(Y1|C)Pr(C)E(Y0|C)Pr(C)Pr(C)=E(Y1|C)E(Y0|C)=LATE.

Dimitriy V. Masterov
la source
+1, je pense que les deux réponses se complètent très bien. Celui-ci montre plus l'intuition de l'estimateur Wald et d'où viennent les hypothèses plutôt que de les utiliser simplement de manière technique
Andy