Une équation de variable d'instrument peut-elle être écrite sous la forme d'un graphique acyclique dirigé (DAG)?

15

Les graphiques acycliques dirigés (DAG) sont des représentations visuelles efficaces d'hypothèses causales qualitatives dans les modèles statistiques, mais peuvent-ils être utilisés pour présenter une équation variable d'instrument régulière (ou d'autres équations)? Si c'est le cas, comment? Sinon, pourquoi?

Tarjei W. Havneraas
la source

Réponses:

11

Oui.

Par exemple, dans le DAG ci-dessous, la variable instrumentale Z provoque X , tandis que l'effet de X sur O est confondu par la variable U non mesurée .

Le modèle de la variable instrumentale pour cette DAG serait d'estimer l'effet causal de X sur O en utilisant E(O|X^) , où X = E ( X | Z ) .X^=E(X|Z)

Cette estimation est une estimation causale non biaisée si:

  1. Z doit êtreassociéàX . Edit:Et, (comme dans le DAG ci-dessus), cette association elle-même doit être non confondue (voirImbens).

  2. Z doit affecter causalementO queparX

  3. Il ne doit pas y avoir de cause préalable des deux O et Z .

  4. L' effet de X sur O doit être homogène. Cette hypothèse / exigence a deux formes, faible et forte :

    • Faible homogénéité de l'effet de X sur O : L' effet de X sur O ne varie pas selon les niveaux de Z (c'est-à-dire que Z ne peut pas modifier l'effet de X sur O ).
    • Forte homogénéité de l'effet de X sur O : L'effet de X sur O est constant pour tous les individus (ou quelle que soit votre unité d'analyse).

Les trois premières hypothèses sont représentées dans le DAG. Cependant, la dernière hypothèse n'est pas représentée dans le DAG.

Hernán, MA et Robins, JM (2019). Inférence causale . chapitre 16: Estimation des variables instrumentales. Chapman & Hall / CRC.

Alexis
la source
2
L'ETA est un effet de traitement moyen, qui est l'effet pour une personne cueillie au hasard dans la population. IV avec une hypothèse de monotonie (ou pas de défier) ​​ne récupère que l'effet de traitement moyen local pour les personnes qui se conforment à la mission, qui est généralement différent de la population ATE s'il y a une hétérogénéité, mais souvent plus intéressant d'un point de vue politique.
Dimitriy V. Masterov
1
@JulianSchuessler Lorsque l'option de stratégie consiste à déplacer l'instrument, LATE / CATE est le bon effet. Par exemple, si la politique est un crédit d'impôt pour les panneaux solaires, l'impact pour ceux qui installent uniquement avec le crédit en place est celui qui est pertinent. Pour la politique, nous nous intéressons souvent au nouvel entrant.
Dimitriy V. Masterov
1
Pourquoi suffit-il que Z ne soit associé qu'à X (critère 1)? Est-il suffisant que Z n'affecte pas X de manière causale mais soit corrélé avec X par le biais d'une variable U non mesurée? Si oui, pourquoi?
Elias
1
@Alexis Merci. J'ai vérifié la figure 16.3, et, intuitivement, je trouve que l'instrument devrait être valide dans ce cas (le prouve-t-il? Je n'ai pas lu le livre). Cependant, supposons qu'il y ait un facteur de confusion non mesuré qui touche Z et A . Alors Z sera toujours corrélé (associé) avec A - mais sera-t-il valide? Non, selon Imbens (page 40, deuxième hypothèse clé, 2019): arxiv.org/pdf/1907.07271.pdf (voir également fig 9c-9d). De plus, la condition n'est pas testable, car nous avons besoin d'une hypothèse causale pour pouvoir dire que V n'est en fait pas un facteur de confusion potentiel. VZUNEZUNEV
Elias
1
@Alexis Je note que même si l'article n'est pas révisé, Imbens est un économétricien de renommée mondiale et un expert dans le domaine. Je voulais faire référence à un article et à un argument accessibles. Son point de vue est également exprimé dans des manuels standard et modernes sur l'inférence causale en économétrie, tels que «L'inférence causale pour les statistiques, les sciences sociales et biomédicales». Je pose ici et V A , en plus des relations causales exprimées dans la fig. 16.3. On peut également envisager V U et U A . Je ne pose pas U Z , bien que cela puisse être considéré. Je suppose que l'on doit contrôler VVZVUNEVUUUNEUZV.
Elias
10

Oui, certainement.

En fait, la littérature SCM / DAG a travaillé sur des notions généralisées de variables instrumentales, vous voudrez peut-être vérifier Brito et Pearl , ou Chen, Kumor et Bareinboim.

Le dag IV de base est généralement représenté comme:

entrez la description de l'image ici

est non observée et Z est un instrument pour l'effet de X sur Y . Bien que ce soit le graphique que vous voyez habituellement, il existe plusieurs structures différentes qui feraient de Z un instrument. Pour le cas de base, pour vérifier si Z est un instrument pour l'effet causal de X sur Y conditionnel à un ensemble de covariables S , vous avez deux conditions graphiques simples:UZXYZZXYS

  1. (Z⊥̸X|S)g
  2. (ZOui|S)gX¯

La première condition nécessite que soit connecté à X dans le DAG d'origine. La deuxième condition nécessite Z à ne pas être connecté à Y si nous intervenons sur X (représenté par le DAG G ¯ X , où vous supprimez les flèches pointant vers X ). Vous pouvez vérifier la causalité (page. 248) .ZXZOuiXgX¯X

Par exemple, considérons le graphique ci-dessous, avec et U non observés. , Ici Z est conditionnelle à L , un instrument de l'effet causal de X sur Y . Nous pouvons créer des cas plus compliqués où il peut ne pas être immédiatement évident de savoir si quelque chose peut être considéré comme un instrument ou non.WUZLXOui

entrez la description de l'image ici

Une dernière chose que vous devez avoir à l'esprit est que l'identification à l'aide de méthodes de variables instrumentales nécessite des hypothèses paramétriques . Autrement dit, trouver un instrument ne suffit pas pour identifier l'effet: vous devez imposer des hypothèses paramétriques, telles que la linéarité ou la monotonie, etc.

Carlos Cinelli
la source
Pourriez-vous préciser comment Z satisfait A1 dans votre deuxième graphique?
Dimitriy V. Masterov
UNE1(Z⊥̸X|L)gWZX