Quelles théories de la causalité devrais-je connaître?

16

Quelles approches théoriques de la causalité devrais-je connaître en tant que statisticien / économètre appliqué?

Je connais le (un tout petit peu)

Quels concepts me manquent ou dois-je être au courant?

Connexes: Quelles théories sont les fondements de la causalité dans l'apprentissage automatique?

J'ai lu ces questions intéressantes et les réponses ( 1 , 2 , 3 ) mais je pense que c'est une question différente. Et j'ai été très surpris de voir que la «causalité», par exemple, n'est pas mentionnée dans Elements of Statistical Learning .

Arne Jonas Warnke
la source
2
Consultez la revue d'Andrew Gelman de plusieurs ouvrages sur la causalité dans AJS: Gelman, A. (2011). Causalité et apprentissage statistique. American Journal of Sociology, 117 (3), 955-966. doi: 10.1086 / 662659 . Il s'agit d'un bref aperçu de la causalité dans les sciences sociales avec des références spécifiques aux travaux de Rubin et Pearl, ainsi que d'autres. Un bon endroit pour parcourir les références.
paqmo
1
Pour commencer, les méthodes de (John Stuart) Mill. en.wikipedia.org/wiki/Mill's_Methods
noumenal
Voir mon commentaire sous la réponse acceptée concernant une possible mauvaise interprétation de la causalité de Granger.
Richard Hardy

Réponses:

17

À proprement parler, la «causalité de Granger» n'est pas du tout une causalité. Il s'agit de la capacité prédictive / de la priorité temporelle, vous voulez vérifier si une série temporelle est utile pour prédire une autre série temporelle --- elle convient aux revendications comme "généralement A se produit avant que B se produise" ou "sachant que A m'aide à prédire que B se produira, mais pas l'inverse "(même après avoir considéré toutes les informations passées sur B ). Le choix de ce nom a été très malheureux, et il est à l'origine de plusieurs idées fausses.

Bien qu'il soit presque non controversé qu'une cause doive précéder son effet dans le temps, pour tirer des conclusions causales avec une priorité dans le temps, vous devez toujours affirmer l'absence de confusion, entre autres sources d'associations fallacieuses.

En ce qui concerne les résultats potentiels (Neyman-Rubin) par rapport aux graphiques causals / modélisation d'équation structurelle (Pearl), je dirais que c'est un faux dilemme et que vous devriez apprendre les deux.

Tout d'abord, il est important de noter qu'il ne s'agit pas de vues opposées sur la causalité . Comme Pearl le dit, il existe une hiérarchie concernant les tâches d'inférence (causales):

  1. Prédiction d'observation
  2. Prédiction sous intervetion
  3. Contrefactuels

Pour la première tâche, il vous suffit de connaître la distribution conjointe des variables observées. Pour la deuxième tâche, vous devez connaître la distribution conjointe et la structure causale. Pour la dernière tâche, des contrefactuels, vous aurez en outre besoin d'informations sur les formes fonctionnelles de votre modèle d'équation structurelle.

Donc, quand on parle de contrefactuels, il y a une équivalence formelle entre les deux perspectives . La différence est que les résultats potentiels prennent les déclarations contrefactuelles comme des primitives et dans les DAG, les contrefactuels semblent dériver des équations structurelles. Cependant, vous pourriez vous demander, s'ils sont "équivalents", pourquoi se donner la peine d'apprendre les deux? Parce qu'il y a des différences en termes de "facilité" à exprimer et à dériver des choses.

Par exemple, essayez d'exprimer le concept de M-Bias en utilisant uniquement les résultats potentiels --- je n'en ai jamais vu de bons. En fait, mon expérience jusqu'à présent est que les chercheurs qui n'ont jamais étudié les graphiques n'en sont même pas conscients. En outre, la formulation des hypothèses de fond de votre modèle dans un langage graphique facilitera le calcul de ses implications testables empiriques et répondra aux questions d'identification. D'un autre côté, il est parfois plus facile de penser directement aux contrefactuels eux-mêmes et de combiner cela avec des hypothèses paramétriques pour répondre à des questions très spécifiques.

Il y a beaucoup plus à dire, mais le fait est que vous devez apprendre à "parler les deux langues". Pour des références, vous pouvez vérifier comment commencer ici.

Carlos Cinelli
la source
1
Pourriez-vous donner un exemple de quelque chose qui est facile à exprimer en termes de bons de commande, mais pas dans les DAG?
Guilherme Duarte
@GuilhermeDuarte quantités de médiation impliquant des contrefactuels imbriqués par exemple
Carlos Cinelli
3
Je pense que votre point de vue sur la causalité de Granger (au moins tel que présenté ici) est un peu imprécis. Causalité de GrangerUNEgrunengerB signifie que UNEa ajouté un pouvoir prédictif lorsque l'histoire deB lui-même est utilisé pour prédire B. Ainsi, les coqs ne provoquent pas le lever du soleil de Granger car ils n'améliorent pas la prédiction du lever du soleil sur la base des données historiques sur les levers de soleil.
Richard Hardy
@RichardHardy Je pense que vous avez raison, peut-être qu'un coq parfait qui chante toujours une heure avant le lever du soleil pourrait avoir un certain pouvoir prédictif au-delà d'un modèle linéaire de séries temporelles du lever du soleil (puisque le lever du soleil n'est pas exactement le même tous les jours), mais avec un modèle parfait cela n'ajoute probablement rien.
Carlos Cinelli
Je pense que la causalité de Granger ne suggère pas d'utiliser des modèles prédictifs inférieurs avec uniquement l'historique de B pour justifier le besoin d'une variable supplémentaire A et donc la causalité de Granger. Plutôt, on viserait idéalement un modèle aussi bon que possible en utilisant sa propre histoire de B et on verrait ensuite si l'ajout de A (sous une forme ou d'une autre) aide à prédire B. Et bien sûr, "un coq parfait" est un concept plutôt utopique. Compte tenu de cela, je pense que la modification de la réponse pour refléter cela pourrait être une bonne idée.
Richard Hardy