Les statisticiens du secteur privé tentent-ils de déterminer la causalité?

12

Les économétriciens universitaires sont souvent intéressés à déterminer la causalité. Il semble que tous les emplois en statistique / science des données du secteur privé dont j'entends parler ne recherchent que des modèles prédictifs.

Y a-t-il des emplois dans le secteur privé (ou des emplois gouvernementaux) qui recherchent la causalité?

Génial38
la source
5
Chaque fois que nous voulons faire une intervention, vous pariez que nous nous soucions. Pensez à tous les tests A / B effectués par Google pour effectuer un simple changement de conception.
Matthew Drury
8
Bien sûr. À peu près tout cas juridique dépend finalement des questions de causalité. Presque tout programme de contrôle de la qualité décent concerne la causalité. Les ingénieurs et les scientifiques s'en soucient beaucoup.
whuber
6
Une autre question classique du secteur privé est la suivante: "Mes annonces génèrent-elles plus de ventes?"
Matthew Gunn
2
@MatthewGunn: +1. En général: "Ce changement (coûteux) fera-t-il une différence?" Il est crucial de supposer qu'une entreprise doit rester à flot (et peut-être prospérer) et avoir une certaine compréhension de la dynamique causale de son marché.
usεr11852
4
Au départ, je me suis abstenu de convertir ce fil de discussion en CW, pensant qu'il était possible qu'une réponse faisant autorité et basée sur les données puisse être proposée. Comme cela ne se passe pas de cette façon, pour diverses raisons que beaucoup pourraient trouver intéressantes et utiles, je l'ai converti en CW. Merci à tous pour vos contributions!
whuber

Réponses:

15

Je suis un économiste en technologie qui travaille sur l'inférence causale avec des données d'observation ou expérimentales erronées. La plupart des grandes entreprises technologiques auront des gens comme moi pour faire de la recherche appliquée sur les prix, le marketing et la conception de produits. Il existe également des équipes de politique publique dans certaines entreprises.

Il y a aussi beaucoup de gens qui travaillent sur l'expérimentation Web. Il s'agit d'un groupe beaucoup plus important.

Enfin, il existe également des types particuliers de conseil en économie, en particulier antitrust, où c'est le principal objectif.

Dimitriy V. Masterov
la source
7

[Les cinq premières réponses émotionnelles censurées.]

Franchement, c'est l'une des questions les plus étranges du site. Et montre à quel point il y a un décalage entre ce que disent vos professeurs et la vraie vie - c'est-à-dire la vie à l'extérieur de la tour d'ivoire. C'est bien que vous en jetiez un coup d'œil ... mais vous (c'est-à-dire les étudiants en doctorat en économie) devez certainement le faire plus souvent.

Oui, il existe des emplois en dehors du milieu universitaire où les gens (surprise, surprise) utilisent des méthodes d'inférence causale. Et (surprise, surprise) publiez des articles. Mes réponses sont spécifiques aux États-Unis, mais je suis sûr que vous pouvez trouver des organisations similaires dans d'autres pays.

  • Exemple 1 (uniquement parce que je le connais en interne dans mon travail). Je travaille dans une filiale d'un grand organisme de recherche sous contrat, Abt Associates . Il emploie environ 2 300 personnes dans 50 pays, et la plupart d'entre elles travaillent à la conduite ou au soutien de la recherche d'évaluation et à la mise en œuvre d'interventions. Jacob Klerman, l' un des 6 meilleurs techniciens (appelé Senior Fellows ), est le rédacteur de Evaluation Review, supervisant un comité de rédaction dont environ 5/6 ont des affiliations académiques. C'est donc un exemple pour vous du secteur privé. (Consultez les annonces de position de l'entreprise pour voir précisément quel type de compétences une entreprise comme celle-ci peut rechercher - je ne suis pas tout à fait sûr que tout le monde annonce chez JOE car c'est cher; je peux facilement nommer une douzaine d'autres aux États-Unis qui seraient heureux d'embaucher un économètre artisan.)
  • Exemple 2 (je n'ai qu'une familiarité passagère avec cela parce que je connais des gens qui ont commencé ce projet à partir d'autres lieux): What Works Clearinghouseau Département fédéral de l'éducation des États-Unis est un site Web consacré à la méta-analyse de l'analyse publiée des programmes éducatifs. Le WWC opère par le biais d'un réseau d'examinateurs qui reçoivent des instructions spécifiques sur ce qui est considéré comme une étude suffisamment rigoureuse pour soutenir les allégations causales, et ce qui ne l'est pas. Il s'avère que la plupart de ces recherches publiées sont de la merde absolue. Comme dans, des conneries. Pas de groupe témoin. Pas de vérification de l'équilibre sur les covariables démographiques / équivalence de référence. Seulement environ 3 à 5% des études (publiées dans la littérature de la revue par les pairs, pour l'amour de Dieu) "répondent aux normes sans réserves" - ce qui signifie qu'elles avaient un semblant de randomisation, d'attrition contrôlée et de contamination croisée des bras de l'expérience, et a fait l'analyse d'une manière plus ou moins acceptable sur toute la ligne. (Par le théorème de Bayes, quand vous entendez quelqu'un dire: "Mais j'ai vu publié que le chewing-gum augmente les performances en mathématiques", vous pouvez répondre "BS", et vous auriez raison 90% du temps.) Quoi qu'il en soit, c'est un gouvernement fédéral projet ministériel, c'est donc un exemple pour vous où un organisme gouvernemental examine la bonne utilisation des outils d'inférence causale. (Jetez votre nom dans le chapeau en tant que réviseur d'étude, ce sera une grande expérience éducative pour vous. Si j'enseignais l'évaluation de programme, j'aurais fait de cela une exigence pour mes étudiants.) (Pour les biostatisticiens travaillant avec la FDA, où vous devez soumettre votre code d'analyse avant de collecter des données, les normes WWC sont encore très laxistes.) d avoir raison 90% du temps.) Quoi qu'il en soit, il s'agit d'un projet du ministère fédéral, c'est donc un exemple pour vous où un organisme gouvernemental examine la bonne utilisation des outils d'inférence causale. (Jetez votre nom dans le chapeau en tant que réviseur d'étude, ce sera une grande expérience éducative pour vous. Si j'enseignais l'évaluation de programme, j'aurais fait de cela une exigence pour mes étudiants.) (Pour les biostatisticiens travaillant avec la FDA, où vous devez soumettre votre code d'analyse avant de collecter des données, les normes WWC sont encore très laxistes.) d avoir raison 90% du temps.) Quoi qu'il en soit, il s'agit d'un projet du ministère fédéral, c'est donc un exemple pour vous où un organisme gouvernemental examine la bonne utilisation des outils d'inférence causale. (Jetez votre nom dans le chapeau en tant que réviseur d'étude, ce sera une grande expérience éducative pour vous. Si j'enseignais l'évaluation de programme, j'aurais fait de cela une exigence pour mes étudiants.) (Pour les biostatisticiens travaillant avec la FDA, où vous devez soumettre votre code d'analyse avant de collecter des données, les normes WWC sont encore très laxistes.)
StasK
la source
Je ne pense pas que les professeurs d'économie disent que vous n'utilisez pas les méthodes causales dans la pratique (personne ne commence une discussion avec "voici quelques méthodes statistiques dont personne ne se souciera"), mais plutôt l'étudiant craint que l'inférence causale ne soit qu'un ivoire sujet de la tour (comme l'estimation de la densité log-concave: je vous assure que personne dans l'industrie ne fait cela, et pour une bonne raison). On ne sait pas non plus comment l'exemple 2 montre que les gens de l'industrie utilisent des méthodes causales?
Cliff AB
@CliffAB Le PO a demandé des exemples de l'industrie et du gouvernement, donc # 2 correspond au projet de loi. Je pense également que l'argument de StasK concernant la faible connaissance de la vie en dehors de la tour d'ivoire parmi les doctorants en économie et, dans une moindre mesure, leurs professeurs, est assez précis, bien qu'il y ait beaucoup d'hétérogénéité entre les domaines et les départements et même dans le temps.
Dimitriy V. Masterov
@ DimitriyV.Masterov: # 2 semble être un exemple de ne pas utiliser les bons outils de causalité. Et j'ai lu (peut-être mal lu) la réponse de StasK comme impliquant que les professeurs disent "personne en dehors des universitaires n'utilise des méthodes causales". Si un professeur spécialisé dans les méthodes causales l'a dit, il admet l'échec; si vous créez des méthodes statistiques appliquées que personne en dehors du monde universitaire n'utilise, ce n'est pas considéré comme une bonne chose. La théorie statistique est bien sûr une histoire différente.
Cliff AB
Ma lecture (encore une fois, peut-être une mauvaise interprétation) de la question du PO est que les professeurs leur disent "les statistiques causales sont importantes!", Et leur réponse est "est-ce vraiment important? Les gens de l'industrie utilisent-ils réellement ces méthodes?". Mais encore une fois, je me trompe peut-être.
Cliff AB
1
@CLIFF WWCH passe en revue la recherche universitaire, séparant le blé de l'ivraie jusqu'à l'inférence causale, ce qui en fait un excellent exemple d'un domaine où les normes sont plus élevées au gouvernement que dans certaines parties du monde universitaire.
Dimitriy V. Masterov
6

Dans les statistiques pharmaceutiques et un certain nombre de domaines connexes, le lien de causalité entre l'intervention et les résultats pour la santé est la principale question d'intérêt pour décider si une intervention doit être utilisée. Il existe un large éventail de sous-domaines tels que les essais randomisés (cliniques ou précliniques), les essais non randomisés ou à bras unique, les expériences de laboratoire, les méta-analyses, la surveillance de l'innocuité des médicaments basée sur la notification spontanée d'événements indésirables, l'épidémiologie (y compris des idées comme la randomisation mandélienne) et la recherche sur l’efficacité (par exemple en utilisant des données d’observation telles que les bases de données sur les réclamations d’assurance). Bien sûr, dans les expériences randomisées conçues (telles que les essais cliniques randomisés), l'attribution de la causalité est un peu plus facile que dans certaines autres applications.

Björn
la source
Je suppose qu'un cadre de développement de médicaments serait l'un des rares endroits où les gens se soucient de la santé des gens plutôt que de leur amélioration, car en fin de compte, vous devez être «en sécurité» dans l'ensemble de la population. - Donc, certainement une belle réponse, mais comme vous le mentionnez, un cas assez spécial.
Dennis Jaheruddin
4

Je suis chercheur à A Place for Mom, le plus grand service d'aiguillage pour personnes âgées au pays. Nous avons conçu un sondage visant à comprendre comment le fait de déménager dans une communauté de vie assistée influe sur la qualité de vie. L'inférence causale est au cœur de cette recherche, et les méthodes d'analyse causale (par exemple, l'appariement, la modélisation des processus de sélection, l'estimation des effets moyens du traitement) sont essentielles.

2 tours
la source
-3

Dans la plupart des situations du secteur privé, vous ne vous souciez pas de la causalité

Dans la pratique, malgré l'usage typique de la langue, les gens sont beaucoup plus souvent intéressés par un impact bien compris , plutôt que par une causalité (bien comprise).

D'un point de vue académique, il est très intéressant de savoir:

Si je fais A, à cause de cela, le résultat sera B

Mais d'un point de vue pratique, dans presque toutes les situations, voici ce que les gens veulent vraiment savoir:

Si je fais A, le résultat sera B

Bien sûr, vous pouvez être intéressé par l'impact de A, mais si c'est vraiment la cause, ou s'il y a une cause cachée qui se produit juste pour créer cette corrélation n'est généralement pas intéressante.

Remarque sur les limitations

Vous pouvez penser: ok, mais si nous ne savons pas que A cause B, alors il est très risqué de travailler sur cette hypothèse.

Cela est vrai d'une certaine manière, mais encore une fois, dans la pratique, vous vous inquiéterez simplement: cela fonctionnera-t-il ou y a-t-il des exceptions?

Pour illustrer cela, vous pouvez noter que cette situation:

Si je fais A, dans la situation X, à cause de A, le résultat sera B et à cause de X, le résultat déviera par delta

N'est pas beaucoup plus utile que cette situation (en supposant que vous pouvez quantifier les impacts également):

Si je fais A, dans la situation X, le résultat sera B et le résultat sera différent par delta

Exemple simple: corrélation à provoquer

  • A: Remplir d'huile moteur
  • B: Rupture de frein réduite
  • C: Bilan de voiture

La logique: C provoque toujours A et B

Relation résultante: si A monte, B monte mais il n'y a pas de relation causale entre A et B.

Mon point: vous pouvez modéliser l'impact de A sur B. A ne cause pas B, mais le modèle sera toujours correct, et si vous avez des informations sur A, vous aurez des informations sur B.

La personne intéressée à la défaillance du frein avec des informations sur A se souciera simplement de connaître la relation de A à B, et se souciera seulement de savoir si la relation est correcte, que cette relation soit causale ou non.

Dennis Jaheruddin
la source
1
Je ne suppose pas que je suis le seul à être troublé par votre distinction entre «cause» et «impact». Vos exemples semblent clarifier un peu les choses: déceler les détails de la chaîne causale pourrait ne pas être particulièrement important. Acheter plus de publicités au coût par clic entraînera une augmentation des ventes - peu importe comment - et c'est ce qui compte pour votre client.
Scortchi - Réintégrer Monica
@Scortchi Ce que je veux dire par cause: «Si A, alors à cause de B». Ce que je veux dire par impact (peut-être pas la définition la plus typique, mais ce n'est pas une question de langage): «Si A alors B». - Exemple de différence pertinente dans le manuel: C cause A et B. Par conséquent, A ne cause pas B, mais je dirais qu'il serait logique de modéliser l'impact de A sur B. - Après avoir relu mon propre commentaire, peut-être «impact» »pourrait être remplacé par« relation réelle avec décalage ».
Dennis Jaheruddin
5
Je ne pense pas être d'accord avec l'exemple publicitaire - si je dois décider d'acheter plus de publicités en ligne, je me soucie de savoir si cela entraînera plus de ventes que de ne pas acheter ces publicités (que ce soit par le biais de plus de clics ou par d'autres signifie = causalité), ce qui peut être différent du fait que les entreprises qui ont augmenté leur publicité en ligne au cours de l'année dernière ont enregistré des augmentations de ventes plus élevées que les entreprises qui ne l'ont pas fait (corrélation). La causalité ne concerne pas les moyens exacts par lesquels le résultat se produit (ce serait bien de savoir, bien sûr), mais plutôt si quelque chose se produit en raison ou en ne faisant pas A.
Björn
6
ABAB
Je ne pense pas être d'accord avec ce commentaire, bien que d'après mon expérience, il est quelque peu vrai que la causalité n'est pas recherchée, bien que dans de nombreux problèmes elle le devrait. En pratique, je vois cela comme presque équivalent à la distinction entre modèles prédictifs et modèles explicatifs.
Thomas Speidel