Exemples réels de corrélation confondus avec causalité

17

Je recherche des cas spécifiques et réels dans lesquels une relation de cause à effet a été indûment déduite de la preuve d'une corrélation.

Plus précisément, je suis intéressé par des exemples qui répondent aux critères suivants:

  • L'existence de la relation causale a été acceptée comme un fait suffisamment répandu pour avoir des effets notables (sur les politiques publiques, le discours, les décisions individuelles, etc.).
  • Le lien a été déduit uniquement sur la base de preuves corrélatives (peut-être avec l'existence d'un mécanisme causal cohérent mais non prouvé).
  • La causalité a été objectivement falsifiée ou du moins mise en doute.

Les deux exemples qui me sont venus à l'esprit ne sont pas tout à fait idéaux:

  1. Apport en sodium et pression artérielle: Si je comprends bien, il a depuis été déterminé que l'apport en sel n'augmente la tension artérielle que chez les personnes sensibles au sodium. L'existence d'une relation causale valide (bien qu'elle ne soit pas tout à fait celle qui a été acceptée à l'origine) rend cet exemple moins convaincant.
  2. Vaccins et autisme: je me trompe peut-être sur le fond, mais je pense que ce lien a été supposé sur la base de corrélations et de preuves expérimentales (frauduleuses). Cet exemple est affaibli par le fait qu'il existait de (fausses) preuves directes.

Remarque: j'ai vu cette question similaire:

Exemples d'enseignement: la corrélation ne signifie pas la causalité

Ma question diffère principalement en ce qu'elle se concentre sur des exemples notables du monde réel et non sur des exemples dans lesquels un lien de causalité est clairement absent (par exemple, le poids et la compétence musicale).

Aaron Novstrup
la source
4
Dans une grande ville en été, le taux de meurtres est en corrélation positive avec le taux de consommation de glaces.
ttnphns
1
L'un de vos critères est "La causalité a été objectivement falsifiée ou du moins mise en doute." OMI c'est trop fort. Une corrélation estimée est un estimateur biaisé d'un effet causal, en supposant une certaine confusion. Généralement, les gens s'intéressent à l'ampleur des effets, pas seulement à leur existence.
generic_user
1
En outre, je parie qu'avec un échantillon suffisamment grand, un ECR qui répartit au hasard la crème glacée dans les villes chaudes trouverait un effet négatif de la consommation de crème glacée sur la probabilité de commettre un meurtre.
generic_user
@ACD intervient en accord pour rendre explicite que, bien sûr, les ECR menacent toujours l'inférence causale.
Alexis
1
@ttnphns C'est un bon exemple du type que j'avais l'intention d' exclure avec mes critères, sauf si vous suggérez qu'une croyance erronée selon laquelle la consommation de crème glacée provoque le meurtre a eu des effets notables sur le comportement humain. ;-)
Aaron Novstrup

Réponses:

11

Pendant de nombreuses années, de grandes études épidémiologiques d'observation interprétées par des chercheurs utilisant des critères heuristiques de type Bradford Hill pour inférer la causalité ont confirmé que le traitement hormonal substitutif (THS) chez les femmes diminuait le risque de maladie coronarienne, et ce n'est qu'après que deux essais randomisés à grande échelle ont démontré la en face, que la compréhension clinique et les recommandations cliniques concernant le THS ont changé. Ce conte de classique édifiant en épidémiologie contemporaine que vous pouvez lire dans les manuels scolaires (par exemple, Leon Gordis' épidémiologie ), et sur l'article de Wikipédia sur la maxime classique de David Hume .

Cela dit, les critères de Bradford Hill ne sont pas compris que l'état de l'art pour un bon moment maintenant, avec contrefactuelle inférence causale ( à la Judea Pearl , Jamie Robbins , Sander Groenland , et d' autres) étant le dispositif de levage vraiment lourd. Il est possible de faire des inférences causales raisonnablement fortes sans mener d'expériences randomisées, en utilisant, par exemple, des variables instrumentales , la randomisation mendélienne , etc. (ce qui est bon pour la science, car nous ne pouvons pas mener d'expériences randomisées sur une grande partie, sinon la plupart, de l'univers. ).

Alexis
la source
2
C'est une excellente réponse et exactement le genre que j'espérais. Cependant, je tiens à signaler à d'autres répondants potentiels qu'un bon exemple ne doit pas nécessairement concerner une inférence faite par des chercheurs / statisticiens (et, en particulier, pas seulement ceux qui utilisent les meilleures méthodes disponibles). Un exemple tout aussi bon pourrait plutôt décrire un cas dans lequel les médias, le public ou un autre groupe ont tiré une inférence causale non valide à partir de preuves corrélatives (tant que cette inférence incorrecte a eu des effets notables).
Aaron Novstrup
4

Ce n'est pas le sujet le plus glamour, mais Nora T. Gedgaudas (Ch. 18) résume très bien le revirement des conclusions sur le rôle des fibres dans la prévention du cancer du côlon. L'étude sur les infirmières de 16 ans portant sur 88000 sujets a montré que les fibres, largement considérées depuis 25 ans comme un facteur préventif important (basé sur la corrélation), n'étaient qu'un corrélat d'autres facteurs importants. Il s'agit notamment de la consommation de fruits et légumes riches en certains nutriments (qui diminuent le risque) et de viande rouge et surtout de viande rouge transformée (qui augmentent le risque). L'auteur note que le mythe "semble néanmoins persister obstinément", même parmi les médecins. Comme cela arrive souvent, une fois que le mot d'un motif est sorti, il est très difficile d'éradiquer l'idée.

rolando2
la source
2
Mise en garde: les études sur les infirmières étaient également des modèles d'observation. Bien qu'il existe des stratégies pour renforcer l'inférence causale, les données de ces études sont également basées sur la corrélation.
Alexis
Bien que votre réponse ait donné un bon exemple dans lequel les contrôles expérimentaux l'emportaient sur les contrôles statistiques, cela ne remet pas nécessairement en question les contrôles purement statistiques tels qu'ils sont utilisés dans d'autres cas. Je pense que les contrôles statistiques sont très bien adaptés au projet de loi.
rolando2
1
Les statistiques ne peuvent pas "contrôler" le biais causal: c'est une fonction du plan d'étude. Tout facteur de confusion potentiel que l'on ajoute à un modèle peut lui - même confondre la relation de cause à effet que vous essayez d'estimer. L'inférence causale par la conception de l'étude passe par une identifiabilité causale (qui est garantie par une assignation aléatoire); aucune méthode d'estimation ou d'inférence ne peut fournir cela.
Alexis
3

Pellagra

Selon ce chapitre du livre , la pellagre , une maladie caractérisée par des étourdissements, une léthargie, des ulcères, des vomissements et une diarrhée sévère qui avait atteint des proportions épidémiques dans le sud des États-Unis au début des années 1900, était largement attribuée à un pathogène inconnu sur la base d'une corrélation avec les conditions de vie insalubres. Le Dr Joseph Goldberger a joué un rôle déterminant en montrant expérimentalement que la maladie était, en fait, causée par une mauvaise alimentation, qui (avec des conditions de vie insalubres) provenait de la pauvreté généralisée dans le sud du post-bellum. Son travail a été largement ignoré jusqu'à la fin des années 1930, lorsque les chercheurs ont finalement prouvé que la maladie était causée par un manque de niacine.

Formation en littératie oculaire

De la même source - une corrélation entre la capacité de lecture (in) et les mouvements oculaires irréguliers pendant la lecture a été prise comme preuve d'une relation causale dans la mauvaise direction , et des "programmes de formation aux mouvements oculaires" ont été mis en œuvre pour améliorer l'alphabétisation. Celles-ci étaient inefficaces et des travaux ultérieurs ont montré que la causalité allait dans le sens opposé; les difficultés de lecture conduisent aux régressions et fixations observées chez les lecteurs pauvres.

Aaron Novstrup
la source
Quel genre de travail plus tard?
rolando2
@ rolando2 Je ne sais pas, malheureusement. Ce chapitre de livre cite "Olsen & Forsberg, 1993" pour cette affirmation, qui je suppose que c'est ce chapitre de Visual Processes in Reading and Reading Disabilities . Ce document étaye également la réclamation.
Aaron Novstrup du
Si quelqu'un reconnaît ce livre , au fait, je voudrais remplacer le lien par une citation appropriée. Le lien semble provenir d'une page de cours de psychologie et il est probable qu'il disparaisse un jour.
Aaron Novstrup du
1
Sur des lignes similaires, on pourrait mentionner le paludisme qui, comme son nom l'indique, était censé être causé par le mauvais air sur la base d'une corrélation avec les régions basses et les marécages (voir l'article de Wikipedia en.wikipedia.org/wiki/Malaria )
mdewey