l'opérateur (x) signifie-t-il?

14

J'ai vu l' opérateur do(x) partout dans une revue de littérature que je fais sur la causalité (voir, par exemple, cette entrée wikipedia ). Cependant, je ne trouve pas de définition formelle et générale de cet opérateur.

Quelqu'un peut-il me désigner une bonne référence à ce sujet? Je m'intéresse à une définition générale plutôt qu'à son interprétation dans une expérience particulière.

Judio
la source

Réponses:

11

C'est -calculus. Ils l'expliquent ici :do

Les interventions et les contrefactuels sont définis par un opérateur mathématique appelé , qui simule les interventions physiques en supprimant certaines fonctions du modèle, en les remplaçant par une constante X = x , tout en gardant le reste du modèle inchangé. Le modèle résultant est noté M x .do(x)X=xMx

mbiron
la source
13

Un modèle de causalité structurale probabiliste (en SCM) est défini comme un triplet U est un ensemble de variables exogènes, V un ensemble de variables endogènes, F est un ensemble d'équations structurelles qui détermine les valeurs de chaque variable endogène et P ( U ) une distribution de probabilité sur le domaine de UM=U,V,F,P(U)UVFP(U)U .

Dans un SCM nous représentons l'effet d'une intervention sur une variable par un sous - modèle M x = U , V , F x , P ( U ) F x indique que l'équation structurelle pour X est remplacée par la nouvelle équation interventionnelle . Par exemple, l'intervention atomique consistant à fixer la variable X à une valeur spécifique x --- généralement désignée par d o ( X = x ) --- consiste à remplacer l'équation pour XXMx=U,V,Fx,P(U)FxXXxdo(X=x)Xavec l'équation .X=x

Pour clarifier les idées, imaginez un modèle causal structurel non paramétrique défini par les équations structurelles suivantes:M

Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)

Où les perturbations ont une distribution de probabilité P ( U ) . Ceci induit une distribution de probabilité sur les variables endogènes P M ( Y , Z , X ) , et en particulier une distribution conditionnelle de Y étant donné X , P M ( Y | X ) .UP(U)PM(Y,Z,X)YXPM(Y|X)

Mais remarquez est la distribution « d' observation » de Y donné X dans le cadre du modèle M . Quel serait l'effet sur la distribution de Y si nous intervenions sur X en le fixant à x ? Ce n'est rien de plus que la distribution de probabilité de Y induite par le modèle modifié M x :PM(Y|X)YXMYXxYMx

Z=UzX=xY=g(X,Z,Uy)

Autrement dit, la probabilité interventionnelle de si nous fixons X = x est donnée par la probabilité induite dans le sous-modèle M x , c'est-à-dire P M x ( Y | X = x ) et elle est généralement désignée par P ( Y | d o ( X = x ) ) . L' opérateur d o ( X = x ) indique clairement que nous calculons la probabilité de YYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Ydans un sous-modèle où il y a un paramètre d'intervention égal à x , ce qui correspond à remplacer l'équation structurelle de X par l'équation X = x .XxXX=x

Le but de nombreuses analyses est de trouver comment exprimer la distribution interventionnelle en termes de probabilité conjointe de la distribution observationnelle (pré-intervention).P(Y|do(X))

faire du calcul

Le do-calcul n'est pas la même chose que l' opérateur . Le do-calcul consiste en trois règles d'inférence pour aider à "masser" la distribution de probabilité post-intervention et obtenir P ( Y | d o ( X ) ) en termes de distribution observationnelle (pré-intervention). Par conséquent, au lieu de faire des dérivations à la main, comme dans cette question, vous pouvez laisser un algorithme effectuer les dérivations et vous donner automatiquement une expression non paramétrique pour identifier votre requête causale d'intérêt (do()P(Y|do(X)) et le do-calcul est complet pour les modèles causaux structurels non paramétriques récursifs ).

Carlos Cinelli
la source
Je pense que vous pouvez être parmi les quelques personnes validées sur cross qui pourraient être intéressées et capables de répondre à cette question: stats.stackexchange.com/q/444249/62396
joshphysics