3 questions connexes sur les estimateurs DDD (TD, triple-diff)

8

Dans l' analyse économétrique de Jeff Wooldridge (2e édition), il dérive l'expression de l'estimateur de la différence dans la différence (DDD) à la page 151 pour le cas à deux périodes où l'État B met en œuvre un changement de politique de soins de santé destiné aux personnes âgées .

Tout d'abord, je suis perplexe de savoir pourquoi l'équation (6.56) n'a pas un quatrième terme de

(y¯A,N,2y¯A,N,1),

ce qui correspondrait à la variation des résultats de santé moyens pour les non-personnes âgées (groupe N) dans les États qui ne modifient pas leur politique (groupe A).

Il cite Gruber (1994) comme utilisant cette méthode, mais ma lecture du tableau 3 dans cet article est que c'est une différence de deux DD, donc vous avez besoin du quatrième terme pour l'avoir (sinon vous obtenez au lieu de juste \ delta_3 ).δ3+δ0δ3

J'ai déjà vérifié les errata pour la deuxième impression, et cela ne s'est pas produit, donc je dois manquer quelque chose ici. Il apparaît également dans ses notes de cours du NBER de 2007 sous la même forme.


Ma deuxième question est que dans le cas de plus de deux périodes, JW suggère une régression qui comprend:

  • un jeu complet de mannequins pour le type d'état (A ou B)
  • un ensemble complet de mannequins pour la catégorie d'âge (E ou N)
  • mannequins pour toutes les périodes
  • interactions par paires entre les trois précédents
  • un mannequin de politique qui prend la valeur 1 pour les groupes et les périodes de temps soumis à la politique, qui est le paramètre DDD d'intérêt

JW écrit des «ensembles complets de variables muettes» et «toutes les périodes», mais je ne sais pas comment cela peut être fait sans tomber dans le piège variable factice. Il peut sembler naturel d'abandonner l'état de type A et celui des personnes non âgées (groupe N), mais disons que j'ai 10 périodes de temps, et le traitement se déroule dans la période 5. Comment choisir quel temps factice laisser tomber pour éviter le mannequin piège variable? Ce choix semble modifier le paramètre DDD et son interprétation, mais je ne sais pas si l'un est le meilleur. Voici une autre question où il y a un choix naturel car il y a une seule période pré qui sert de référence.


Enfin, quelle est exactement l'hypothèse d'identification avec DDD, analogue aux tendances courantes avec DD simple? Existe-t-il des moyens de le tester / le renforcer sur plusieurs périodes?

Dans la micro-économétrie de Myoung-jae Lee pour les effets de politique, de programme et de traitement , la condition (traduite dans l'exemple de JW) est répertoriée comme

δ3+E[u1,2u0,1|E=1,B=1]E[u0,2u0,1|E=1,A=1]E[u0,2u0,1|N=1,B=1]E[u0,2u0,1|N==1,A=1],
où le premier indice indexe le résultat potentiel (1 traité, 0 sinon) et le second est le temps (post est 2, pré est 1). J'interprète cela comme disant que tant que le changement des inobservables au fil du temps pour les personnes âgées dans l'état traité par rapport aux personnes âgées ailleurs est similaire est de l'ampleur de la même quantité pour les non-personnes âgées, alors le DDD identifie l'effet correct. Cela semble plus faible que les tendances courantes, ce qui serait suffisant, mais pas nécessaire pour DDD. Est-ce correct?
Dimitriy V. Masterov
la source

Réponses:

2
  1. Tu as raison. Dans ce diaporama de 2011 , l'équation (4), diapositive 6, montre le terme manquant. Comme vous le mentionnez, l'interprétation à retenir est qu'une triple différence est une différence entre deux différences de différences.
  2. Vous avez raison de mentionner que l'estimation vous oblige à omettre une catégorie de référence pour vos effets fixes de temps, d'état et de groupe d'âge (pour éviter la colinéarité). Cependant, le choix de la catégorie de référence ne devrait pas avoir d'importance pour l'estimateur du terme à triple différence. Notez que vous pouvez écrire directement vos variables muettes sous forme d'interactions entre des périodes, des états et des groupes d'âge, voir l'équation dans les notes de cours de Pischke (bas de la page 16).
  3. Une façon de formuler l'hypothèse d'identification est la suivante. En DiD standard, vous aimeriez que vos deux groupes aient évolué de manière similaire si le traitement n'avait pas existé. En triple différence, vous aimeriez que l'écart entre votre état traité et vos états évolue de façon similaire dans le temps pour les personnes âgées et les plus jeunes, en l'absence de traitement. Vous pouvez également l'encadrer en changeant d'état et de groupe d'âge. La façon dont vous testeriez empiriquement cela serait d'abord de regarder les tendances avant le traitement (si vous avez des données avant qu'il ne se produise). Dans un cas DiD, il vous suffit de tracer la moyenne traitée et de contrôle pour chaque année avant le traitement. Dans le cas de la triple différence, vous pouvez faire de même avec quatre lignes ou, plus commodément, vous pouvez tracer des écarts entre les états traités et témoins, pour chaque groupe d'âge et année,
Roland
la source
1.) Juste pour clarifier, je pense que l'omission est intentionnelle. Ce quatrième terme devrait être abandonné car sa valeur attendue est zéro. En d'autres termes, pourquoi l'État qui ne reçoit pas de traitement observerait-il un effet différentiel dans la population âgée? 2.) Peut-on y parvenir en utilisant une tendance temporelle linéaire, puis en interagissant les variables de traitement avec la tendance temporelle linéaire? Le mannequin d'état est-il absolument nécessaire? 3.) Je pense que vous pouvez tester cela de la même manière que vous testez les tendances parallèles. Placez un ensemble de variables d'interaction antérieures. Les tests t individuels devraient vous donner peu d'importance.
JuliusBilly