Exemples de mauvaise application du théorème de Bayes

11

Cette question de la communauté Math Overflow demandait des "exemples de mauvais arguments qui impliquent l'application de théorèmes mathématiques dans des contextes non mathématiques" et a produit une liste fascinante de mathématiques appliquées pathologiquement.

Je m'interroge sur des exemples similaires d'utilisations pathologiques de l'inférence bayésienne. Quelqu'un a-t-il rencontré des articles académiques, des articles de blog excentriques qui utilisent des méthodes bayésiennes de manière grincheuse.

Chris Brent
la source

Réponses:

3

Oui. J'ai récemment été embauché en tant que consultant statistique pour examiner un article particulier (vraiment horrible) dont les auteurs ont réussi à se faire encore pire dans une lettre à l'éditeur utilisant le théorème de Bayes. Ils ont commencé avec une valeur prédictive positive mal calculée de leur article (PPV = 95% soi-disant). Ils ont essentiellement ignoré une lettre critique à ce sujet de Ricci (2004) qui tentait (et échouait) de leur dire comment ils auraient dû le calculer (il a suggéré 82,3%). Ils ont ensuite trouvé un manuel sur les biostats (Elston & Johnson, 1994) et l'ont mal cité. Nous avons acheté le livre et vérifié, mais rétrospectivement, c'était tout aussi inutile que je ne le pensais. Obtenez une charge de ce gâchis (de la lettre de réponse de Barsness et al. À l'éditeur):

P=P(S/1)P(S/1)+P(S/2)
[p=95/(95+1,6)]est de 98,3%. En utilisant le calcul PPV inférieur susmentionné de 82,3%, la probabilité d'un événement réel est de 98,1%.

Vous voyez quelque chose d' étrange cohérent ici? Bien sûr que non ...

  1. C'est le théorème de Bayes tel qu'Elston et Johnson (1994) l' appliquent à un exemple d'hérédité de l'hémophilie:

    P(1|S)=P(1)P(S|1)P(1)P(S|1)+P(2)P(S|2)

    Les écarts parlent d'eux-mêmes, mais voici une citation de leur discussion de l'exemple:

    Le fait qu'elle ait eu un fils qui n'est pas affecté diminue la probabilité qu'elle ait hérité du gène de l'hémophilie, et donc la probabilité que son deuxième fils soit affecté.

    Lorsque Barsness et ses collègues ont eu l'idée qu'une faible prévalence renforçait le PPV, je ne sais pas, mais ils ne prêtaient certainement pas attention à leur propre manuel de choix.

  2. p1=95/(95+1,6)=98,3p2=98,3/(98,3+1,6)=98,4
    limkpk(pk-1,1,6)
  3. En utilisant leurs informations de prévalence et certaines estimations raisonnables de sensibilité et de spécificité d'autres études sur le sujet, le PPV s'avère être beaucoup plus faible (peut-être aussi bas que 3%). Ce qui est drôle, c'est que je n'aurais même pas pensé utiliser le théorème de Bayes s'ils n'avaient pas essayé de l'utiliser pour renforcer leur cas. Il est clair que cela ne fonctionnera pas de cette façon étant donné une prévalence de 1,6%.


Références
· Barsness, KA, Cha, ES, Bensard, DD, Calkins, CM, Partrick, DA, Karrer, FM et Strain, JD (2003). La valeur prédictive positive des fractures des côtes comme indicateur d'un traumatisme non accidentel chez les enfants. Journal of Trauma-Injury, Infection, and Critical Care, 54 (6), 1107–1110.
· Elston, RC et Johnson, WD (1994). Essentials of biostatistics (2e éd.). Philadelphie: FA Davis Company.
· Ricci, LR (2004). Lettres à l'éditeur. Journal of Trauma-Injury, Infection, and Critical Care, 56 (3), 721.

Nick Stauner
la source