Pourquoi utiliser des variables de contrôle dans les différences de différences?

10

J'ai une question sur l'approche des différences dans les différences avec l'équation standard suivante: où Treat est une variable fictive pour le groupe et le poste traités.

y = a + b_{1} treat + b_{2} post + b_{3} treat \cdot post + u

$y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u$

Maintenant, ma question est simple: pourquoi la plupart des articles utilisent-ils encore des variables de contrôle supplémentaires? Je pensais que si l'hypothèse de tendance parallèle est correcte, nous ne devrions pas avoir à nous soucier de contrôles supplémentaires. Je ne pouvais penser qu'à 2 raisons possibles pour lesquelles utiliser des variables de contrôle:

sans eux, les tendances ne seraient pas parallèles
parce que la spécification DnD attribue toute différence de tendance entre le traitement et le groupe témoin au moment du traitement à l'intervention (c.-à-d. le terme d'interaction traiter * après) - lorsque nous ne contrôlons pas les autres variables, le coefficient de l'interaction peut être dépassé - / discret

Quelqu'un pourrait-il faire la lumière sur cette question? Mes raisons 1) ou 2) ont-elles un sens? Je ne comprends pas bien l'utilisation des variables de contrôle en DnD.

regression multiple-regression causality sachin
la source

Le besoin de variables de contrôle supplémentaires peut dépendre du fait que le groupe de traitement a été sélectionné au hasard dans un groupe plus large, le reste devenant des contrôles ou (comme c'est plus souvent le cas dans l'analyse post-hoc) en raison de certaines caractéristiques spécifiques.

Henry

5

sans eux [c.-à-d. des variables supplémentaires], les tendances ne seraient pas parallèles

Oui c'est vrai. Il peut y avoir des tendances spécifiques à l'unité dont vous ne tenez pas compte, sauf si vous ajoutez des variables variant dans le temps au modèle.

Même si l'hypothèse des tendances parallèles est satisfaite sans variables supplémentaires, l'ajout de variables supplémentaires peut augmenter la précision de vos estimations, tout comme dans d'autres régressions. Je pense que cela fait partie de ce que Michael Chernick a en tête.

La plupart du temps, Econometrics inoffensif a une discussion intéressante qui peut être utile. Voir notamment pages 236-37.

user697473
la source

1

Parfois, lorsque nous examinons un effet du traitement en calculant la différence sur la réponse après le traitement ou le prétraitement, nous disons que le patient agit comme son propre contrôle. Le but de fournir un groupe témoin est de tenir compte de ce que l'on appelle l'effet placebo. Parfois, il peut y avoir un changement positif même si le traitement n'est pas appliqué. L'effet que nous voulons déterminer est donc l'augmentation moyenne au-dessus de «l'effet placebo».

Michael R. Chernick
la source

Salut Michael, merci pour ta réponse. Je pense que je comprends pourquoi nous avons besoin de groupes de contrôle. Le groupe témoin est incorporé dans mon équation de régression car ceux qui n'ont pas de traitement = 1. Ce n'est donc pas vraiment la question ici. La question est de savoir pourquoi certains articles utilisent des variables de contrôle supplémentaires en plus de l'équation indiquée ci-dessus. Ce serait génial si vous pouviez répondre à cela ou peut-être à quelqu'un d'autre. Merci les gars!

sachin

Pourquoi appelez-vous les variables de contrôle des variables supplémentaires? La seule raison pour laquelle je pouvais voir l'inclusion de variables supplémentaires dans le modèle était que les variables pouvaient expliquer une partie de la variation de la réponse qui n'était pas expliquée par les autres variables du modèle.

Michael R. Chernick

Eh bien, c'est essentiellement ma question: pourquoi inclure ces variables (c'est-à-dire les variables de contrôle qui sont incluses parce que, comme vous le dites, elles pourraient expliquer quelque chose que nous prétendons que le traitement explique) lorsque vous supposez que l'hypothèse de tendance parallèle est vraie? Je ne pouvais que supposer que l'inclusion de contrôles supplémentaires signifiait assouplir cette hypothèse - c'est-à-dire voir combien le traitement pouvait expliquer, même en contrôlant d'autres variables. Cela pourrait être une conséquence de l'impossibilité de tester pleinement l'hypothèse de tendance parallèle et pourrait convaincre davantage le lecteur de l'effet du traitement. Mais

je

L'effet sur la réponse ne doit pas provenir uniquement du traitement. Je dis que d'autres variables pourraient expliquer la variation de la réponse qui sont indépendantes du traitement. Cela n'a rien à voir avec un traitement qui interagit avec quoi que ce soit.

Michael R. Chernick

1

Oui, vos deux points ont du sens. Pour voir une dérivation de deux saveurs différentes de modèles diff-in-diff, vous pouvez voir mes diapositives de conférence sur le sujet .

Charlie
la source

1

Poursuivant la réponse de Michael, vous voulez fournir autant de preuves que possible que E [u | traiter] = 0. C'est une hypothèse et jamais directement vérifiable, mais vous voulez donner autant de confiance aux lecteurs que vous avez pensé pourquoi peut tenir. L'ajout de contrôles commence effectivement à décomposer u. Et, certains contrôles peuvent ne pas atteindre tout ce que vous souhaitez, mais peuvent vous donner une idée du type de choses dont vous pourriez ne pas avoir à vous soucier. Par exemple, si vous aviez un contrôle pour le QI, cela pourrait aider à apaiser les inquiétudes des variables omises sur la capacité.

user1690130
la source

Pourquoi utiliser des variables de contrôle dans les différences de différences?

Réponses: