Introduction à l'analyse causale

25

Quels sont les bons livres qui introduisent l'analyse causale? Je pense à une introduction qui explique à la fois les principes de l'analyse causale et montre comment différentes méthodes statistiques pourraient être utilisées pour appliquer ces principes.

Jack Tanner
la source
Vous pouvez essayer cet article de Krider mktsci.journal.informs.org/content/24/4/635.abstract qui a une technique graphique simple. En cours de route, il a une explication assez simple de certaines techniques causales. Je fais juste un commentaire car ce n'est pas exactement ce que vous avez demandé.
zbicyclist
4
Judea Pearl. Causalité: modèles, raisonnement et inférence. Cambridge Univ.Press, 2000. (ISBN 0521773628)
Deer Hunter
3
Chen & Pearl ont un rapport sur Regression and Causation: A Critical Examination Econometrics Textbooks
Jack Tanner
2
Pour moi, la chose la plus importante à savoir est qu'il n'y a aucune information dans vos données qui prouverait qu'un effet est causal . Les informations doivent provenir d'externalités, par exemple la conception expérimentale.
Frank Harrell

Réponses:

15

Essayez Morgan et Winship (2007) pour une prise en sciences sociales ou Hernan et Robins (à paraître) pour une prise épidémiologique. Bien que toujours en cours, cela semble être très bon.

Morgan et Winship sont particulièrement bons sur ce qui doit être supposé pour les interprétations causales des modèles de type régression.

Pearl (2000) n'est en aucun cas une introduction, bien que finalement une très bonne lecture. Vous pouvez trouver certains de son site Web et des articles spécifiques utiles, en particulier sur l'interprétation des modèles d'équations structurelles. Ils sont principalement disponibles sous forme de rapports techniques.

Mise à jour : Pearl, Glymour et Jewell's (2017) Causal Inference in Statistics: A Primer , est cependant une introduction. Et très bien aussi.

conjugateprior
la source
2
Je pense que M&W date de 2007.
Dimitriy V. Masterov
Merci @ DimitriyV.Masterov Je ne sais pas comment cette date s'est infiltrée après avoir passé les dernières semaines à enseigner!
conjugateprior
Il y a maintenant une deuxième édition de Morgan and Winship, qui est très différente de la première. J'appuie fortement le pointeur sur le "Primer" Pearl / Glymour / Jewell. IMHO la meilleure introduction à l'inférence causale.
Julian Schuessler
@JulianSchuessler: Pouvez-vous s'il vous plaît dire quelle est la différence? (Je possède la deuxième édition mais je n'ai pas la première, donc je suis curieux.)
usεr11852 dit Reinstate Monic
@JulianSchuessler Je n'ai pas les deux sous la main, mais la réponse courte est: 7 ans et environ 200 pages (2e éd. Plus longue)
conjugateprior
15

Pearl a récemment publié un nouveau livre destiné aux débutants: Inférence causale dans les statistiques: une introduction . Si vous n'avez jamais vu de causalité avec des graphiques acycliques dirigés auparavant, c'est là que vous devriez commencer. Et vous devriez faire toutes les questions d'étude du livre —— cela vous aidera à vous familiariser avec les nouveaux outils et la notation.

Pearl publie également un livre destiné au grand public, The Book of Why, qui sera disponible en mai 2018.

Destiné également aux débutants, Miguel Hernán vient de commencer un nouveau cours d'inférence causale sur les diagrammes de causalité edX : Dessinez vos hypothèses avant vos conclusions.

Dans le Manuel d'analyse causale pour la recherche sociale , il y a aussi un très bon texte de Felix Elwert, chapitre 13, qui est une introduction très conviviale aux modèles graphiques.

Pearl (2003 ) et Pearl (2009) sont deux autres bons articles avec des «introductions douces» (comme Pearl aime à le dire) aux graphiques causaux . Le premier document contient également des discussions.

Comme d'autres l'ont mentionné, Morgan and Winship est un très bon manuel --- pour les spécialistes des sciences sociales, une introduction très sympathique mais complète --- et il couvre à la fois les modèles graphiques et les résultats potentiels.

Il y a un livre récent d'Imbens et Rubin , qui couvre dans une plus grande mesure certaines parties d'expériences randomisées, mais il n'y a rien sur DAGS --- il ne vous exposera qu'au cadre de résultats potentiels, vous devez donc le compléter avec d'autres livres, comme celui mentionné ci-dessus.

Parmi les économistes, les livres des cycles supérieurs et de premier cycle d'Angrist et Pischke sont populaires. Mais il est important de noter qu'ils se concentrent sur des stratégies / astuces communes --- variables instrumentales, différences dans les différences, RDD, etc. Vous pouvez donc avoir une idée d'une perspective plus appliquée, mais avec seulement cela, vous n'obtiendrez pas la plus grande image sur les problèmes d'identification.

Si vous êtes intéressé par la découverte causale et que vous souhaitez une approche davantage orientée Machine Learning, Peters, Janzing et Scholkopf ont un nouveau livre sur Elements of Causal inference , le pdf est gratuit.

Il convient de mentionner ici le prix "Causalité dans l'enseignement de la statistique". Sur sa page Web, vous trouverez des diapositives et d'autres documents pour plusieurs classes qui ont remporté le prix chaque année depuis son début en 2013. Dans cette veine, il convient également de noter le livre de VanderWeele.

Enfin, comme évidemment déjà mentionné, il y a le livre désormais classique de Pearl . Les lectures des documents plus préliminaires cités ci-dessus vous aideront à le lire.

Carlos Cinelli
la source
3
Je suis totalement d'accord avec cet aperçu; sauf que je recommanderais le Pearl / Glymour / Jewell "Primer" encore plus fort.
Julian Schuessler
9

J'ai de très grandes attentes pour le prochain livre d'Austin Nichols, Causal Inference: Measuring the Effect of x on y . La date de publication prévue est 2013 . Entre-temps, son document et son article donnent un bon aperçu des méthodes de panel, des variables instrumentales, de l'appariement / repondération des scores de propension et de la discontinuité de la régression. Les comparaisons entre tous ces estimateurs (et ECR) sont particulièrement utiles, ainsi que les mini-didacticiels Stata (qui peuvent être ignorés si vous n'êtes pas un utilisateur Stata). Des références organisées sont fournies si vous souhaitez approfondir. Malheureusement, il n'y a pas grand-chose sur les équations structurelles ici, bien que cela soit également vrai pour le livre Morgan and Winship. Leur papier ARS est un aperçu plus court, quoique quelque peu daté.

J'ai trouvé que Pearl était une introduction intéressante mais difficile à ce matériau. Si c'était ma première exposition à ces idées, je ne sais pas si je me serais éloigné après l'avoir lu en sachant comment appliquer l'une des méthodes très bien.

Enfin, voici des présentations vidéo et des diapositives par l'économiste James Heckman et Pearl du Symposium sur l'inférence causale 2012 à l'Université du Michigan. Beaucoup de choses sur les modèles structurels ici.

Dimitriy V. Masterov
la source
3

Le manuel de Cosma Shalizi, Advanced Data Analysis from an Elementary Point of View, présente une excellente couverture des causes. (Le manuel est encore sous forme de projet et est disponible en ligne sous forme de pdf, il a donc l'avantage supplémentaire d'être gratuit.)

Vous devez cependant décider si vous êtes intéressé par les méthodes pour (a) estimer la taille des effets causals , ou (b) apprendre la structure des réseaux causaux (c'est-à-dire apprendre quelles variables influencent quelles autres). Il existe de nombreuses références pour (a), je pense que la causalité de Pearl est la meilleure. Il existe peu de références introductives pour (b); Je pense que le manuel de Cosma est le meilleur, mais il n'est pas complet.

La CMU a organisé de superbes discussions introductives sur l'apprentissage de la structure causale en 2013. Richard Scheines a présenté un didacticiel sur l'inférence causale à l'aide de Tetrad , une introduction longue et douce aux concepts de base. Frederick Eberhardt a présenté All of Causal Discovery , un aperçu rapide de l'état de l'art. Un ou les deux peuvent être utiles; Le discours de Frédéric devrait vous donner beaucoup d'idées sur la prochaine étape.

Lizzie Silver
la source
0

Je recommanderais:

Analyse des données à l'aide de modèles de régression et multiniveaux / hiérarchiques (Gelman & Hill)

Chapitre9 et Chapitre10 sont sur l' inférence causale et accessible au public.

Gelman est connu pour être un grand auteur qui décrit à fond les concepts complexes.

Considérez également son blog Web: http://andrewgelman.com/ il y a beaucoup de documents sur l'inférence causale.

Vous n'obtenez pas l'image complète de toutes les méthodes possibles, mais vous obtiendrez probablement une explication très détaillée de ce qui se passe.

PS: L'analyse des effets du traitement dans 8 écoles de Gelman est devenue un exemple classique de statistiques bayésiennes de modélisation hiérarchique.

Vlad Vlaskin
la source