Habituellement, lorsque nous faisons une estimation de différence dans les différences, nous le faisons sous une forme réduite OLS comme suit: Cependant, je me demandais si le groupe de est endogène (par exemple auto-sélectionné), mais nous pouvons définir un groupe "éligible" pour le traitement, s'il serait plus précis d'estimer un diff -in-diff sous une forme OLS / 2SLS comme: et get , puis T r e a t m e n
T r e a t m e n t i , t = c o n s t a n t + α A f t e r t + γ E l i g i b l e i + δ A f t e r ∗ E l i g i b l e i , t +
Comment comprendre le diff-in-diff sous une forme OLS / 2SLS? Existe-t-il des documents utilisant cette stratégie d'identification particulière que je pourrais jeter un œil?
Merci beaucoup d'avance!
Réponses:
Eh bien, si vous pensez que le traitement est endogène (ce qui dépend du problème en cause ici et n'est pas une caractéristique inhérente du modèle), alors l'utilisation de l'éligibilité comme variable instrumentale vous aidera à vous débarrasser des biais dus à la sélection sûre en traitement. (Soit dit en passant, DID est censé faire la même chose, mais ne fera pas un aussi bon travail qu'un instrument bien choisi, il y a donc des doutes quant à savoir s'il est préférable de les appliquer tous les deux plutôt que d'en avoir recours à un seul). Cependant, c'est à vous de décider si l'admissibilité est exogène, comme il se peut, que ceux qui s'attendent à un retour plus élevé au traitement se soient assurés d'être éligibles.
Étant donné que nous pensons qu'il existe certains biais qui ne sont pas éliminés par DID et que l'admissibilité peut nous aider, il y a encore des considérations d'efficacité. Dans de nombreux cas, l'éligibilité peut s'avérer être un instrument faible, puis la réduction du biais entraînera une perte d'efficacité considérable.
Et en regardant la spécification particulière que vous avez suggérée, cela ne semble pas très raisonnable dans un cadre général. Vous pouvez choisir lorsque vous pensez que l'admissibilité change rapidement, ou le terme d'interaction dans la deuxième équation sera généralement inutile. Inclusion de temps Après, cette équation peut avoir des conséquences encore plus drastiques, car elle est susceptible d'être endogène et d'affaiblir l'effet de réduction du biais. S'il n'est pas endogène, il est probable qu'il soit négligeable ainsi que l'interaction, à moins que le traitement ne change rapidement de lui-même.
Donc, dans ce cas, je recommanderais de ne laisser que l'éligibilité en tant qu'instrument dans la première équation et de spécifier le troisième dans un formulaire DID.
En ce qui concerne l'interprétation, ma spécification ne permet pas une bonne interprétation de la différence dans les changements dans deux sous-groupes et devrait être interprétée comme une différence dans les changements dans deux sous-groupes hypothétiques où chaque personne est divisée entre eux avec quelques poids.
Votre spécification, cependant, perd toute interprétation en tant que DID, car vous n'utilisez pas le coefficient d'interaction résultant, mais utilisez simplement plus de variables comme instruments de traitement.
Malheureusement, probablement pour les raisons susmentionnées, je n'ai pas pu me souvenir ni trouver de papier approprié, désolé.
la source
Le problème de la sélection dans le traitement basé sur une variable observable qui n'entre pas dans l'équation du résultat est résolu avec une approche d'indice latent ou une méthode de Heckman en 2 étapes. Une difficulté avec Heckman 2 étapes est la nécessité de trouver un instrument valide, mais si vous en avez déjà un, cela résoudra votre problème de traitement endogène.
la source