Différence entre les échelons deux et trois dans l'échelle de causalité

12

Dans le "Livre de pourquoi" de Judea Pearl, il parle de ce qu'il appelle l'échelle de causalité, qui est essentiellement une hiérarchie composée de différents niveaux de raisonnement causal. Le plus bas concerne les modèles d'association dans les données observées (par exemple, corrélation, probabilité conditionnelle, etc.), le suivant se concentre sur l'intervention (que se passe-t-il si nous modifions délibérément le processus de génération de données d'une manière prédéfinie?), Et le troisième est contrefactuel (que se passerait-il dans un autre monde possible si quelque chose s'était produit ou non)?

Ce que je ne comprends pas, c'est comment les barreaux deux et trois diffèrent. Si nous posons une question contrefactuelle, ne posons-nous pas simplement une question sur l'intervention afin de nier un aspect du monde observé?

dsaxton
la source
Est-ce vraiment sur le sujet? Demander par curiosité
Firebug
5
@Firebug est la causalité sur le sujet? Si vous voulez calculer la probabilité de contrefactuels (comme la probabilité qu'un médicament spécifique soit suffisant pour la mort d'une personne), vous devez comprendre cela.
Carlos Cinelli

Réponses:

13

Il n'y a pas de contradiction entre le monde factuel et l'action d'intérêt au niveau interventionnel. Par exemple, fumer jusqu'à aujourd'hui et être obligé d'arrêter de fumer à partir de demain ne sont pas en contradiction, même si vous pourriez dire que l'un «nie» l'autre. Mais imaginez maintenant le scénario suivant. Vous connaissez Joe, un fumeur à vie qui a un cancer du poumon, et vous vous demandez: et si Joe n'avait pas fumé pendant trente ans, serait-il en bonne santé aujourd'hui? Dans ce cas, nous avons affaire à la même personne, en même temps, imaginant un scénario où l'action et le résultat sont en contradiction directe avec des faits connus.

Ainsi, la principale différence entre les interventions et les contrefactuels est que, alors que dans les interventions, vous demandez ce qui se passera en moyenne si vous effectuez une action, dans les contrefactuels, vous demandez ce qui se serait passé si vous aviez adopté une ligne de conduite différente dans une situation spécifique , étant donné que vous disposez d'informations sur ce qui s'est réellement passé. Notez que, puisque vous savez déjà ce qui s'est passé dans le monde réel, vous devez mettre à jour vos informations sur le passé à la lumière des preuves que vous avez observées.

Ces deux types de requêtes sont mathématiquement distincts car ils nécessitent différents niveaux d'information pour être répondu (les contrefactuels ont besoin de plus d'informations pour être répondu) et un langage encore plus élaboré pour être articulé!.

Avec les informations nécessaires pour répondre aux questions de Rung 3, vous pouvez répondre aux questions de Rung 2, mais pas l'inverse. Plus précisément, vous ne pouvez pas répondre à des questions contrefactuelles avec uniquement des informations interventionnelles. Des exemples où le choc des interventions et des contrefactuels se produit ont déjà été donnés ici dans CV, voir ce post et ce post . Cependant, par souci d'exhaustivité, je vais également inclure un exemple ici.

L'exemple ci-dessous se trouve dans Causalité, section 1.4.4.

x=1x=0y=0y=1P(y|x)=0.5   x,y

P(Y=1|do(X=1))P(Y=1|do(X=0)=0

P(Y0=0|X=1,Y=1)

On ne peut pas répondre à cette question uniquement avec les données interventionnelles dont vous disposez. La preuve est simple: je peux créer deux modèles causaux différents qui auront les mêmes distributions interventionnelles, mais des distributions contrefactuelles différentes. Les deux sont fournis ci-dessous:

entrez la description de l'image ici

UP(y,x)

Notez que, dans le premier modèle, personne n'est affecté par le traitement, donc le pourcentage de patients décédés sous traitement qui se seraient rétablis s'ils n'avaient pas suivi le traitement est nul.

Cependant, dans le deuxième modèle, chaque patient est affecté par le traitement, et nous avons un mélange de deux populations dans lesquelles l'effet causal moyen s'avère nul. Dans cet exemple, la quantité contrefactuelle passe désormais à 100% --- dans le modèle 2, tous les patients décédés sous traitement se seraient rétablis s'ils n'avaient pas suivi le traitement.

Ainsi, il existe une distinction claire entre l'échelon 2 et l'échelon 3. Comme le montre l'exemple, vous ne pouvez pas répondre à des questions contrefactuelles avec uniquement des informations et des hypothèses sur les interventions. Cela ressort clairement des trois étapes du calcul d'un contrefactuel:

  1. P(u)P(u|e)
  2. do(x))
  3. Y

Cela ne sera pas possible de calculer sans certaines informations fonctionnelles sur le modèle causal, ou sans certaines informations sur les variables latentes.

Carlos Cinelli
la source
Réponse intéressante! Quelques suivis: 1) Vous dites " Avec les informations de Rung 3, vous pouvez répondre aux questions de Rung 2, mais pas l'inverse ". Mais dans votre exemple de tabagisme, je ne comprends pas comment savoir si Joe serait en bonne santé s'il n'avait jamais fumé répond à la question «Serait-il en bonne santé s'il arrêtait demain après 30 ans de tabagisme». Ils semblent être des questions distinctes, donc je pense que je manque quelque chose.
mkt
De plus, votre exemple de travail subséquent repose sur la répartition non aléatoire des 2 variables non observées entre le traitement et le contrôle. Mais vous avez décrit cela comme une expérience randomisée - n'est-ce pas un cas de mauvaise randomisation? Avec une randomisation appropriée, je ne vois pas comment vous obtenez deux résultats différents à moins que je manque quelque chose de basique.
mkt
@mkt du dernier au premier. La variable non observée est diffusée aléatoirement entre le traité et le contrôle, vous avez exactement 50% de chaque catégorie d'u dans les deux bras. Par information, nous entendons la spécification partielle du modèle nécessaire pour répondre aux requêtes contrefactuelles en général, et non la réponse à une requête spécifique. Pour répondre aux requêtes contrefactuelles, vous avez besoin de la structure causale + quelques informations fonctionnelles ou des informations sur la distribution des variables latentes.
Carlos Cinelli
0

Voici la réponse de Judea Pearl sur Twitter :

Les lecteurs demandent: Pourquoi l'intervention (Rung-2) est-elle différente de contrefactuelle (Rung-3)? L'intervention n'annule-t-elle pas certains aspects du monde observé?

Rép. Les interventions changent mais ne contredisent pas le monde observé, car le monde avant et après l'intervention comporte des variables temporelles. En revanche, «si j'étais mort» contredit des faits connus. Pour une discussion récente, voir cette discussion .

Remarque: Le groupe #causalinference de Harvard et le cadre de résultats potentiels de Rubin ne distinguent pas Rung-2 de Rung-3.

Il s'agit, je crois, d'une résistance culturellement enracinée qui sera rectifiée à l'avenir. Elle découle de l'origine des deux cadres dans la métaphore "comme si randomisée", par opposition à la métaphore physique "d'écoute" de #Bookofwhy

Benjamin Crouzier
la source