Quel hôpital choisir? L'un a un taux de réussite plus élevé, mais l'autre a un taux de réussite global plus élevé

27

J'ai une question à propos de quelque chose que mon professeur de statistique a dit au sujet du problème suivant. Ma question n'est même pas sur l'occurrence du paradoxe de Simpson dans cette situation. Ma question concerne simplement l'insistance de mon professeur pour que A) et D) soient les bonnes réponses au lieu de A) et F). Il a dit:

"Parce que le taux de réussite est si faible pour les chirurgies de type E, nous pouvons conclure qu'elles sont difficiles et pas seulement rares. Par conséquent, Mercy a probablement un meilleur équipement / médecins par rapport à Hope."

Je ne comprends pas comment il pourrait inférer statistiquement que Mercy fait "des chirurgies plus difficiles". Mercy a de toute évidence un meilleur taux de réussite dans les chirurgies de type E, mais pourquoi cela signifie-t-il que les chirurgies sont plus difficiles Je pense que je suis foutu par la formulation de ce problème et le professeur ne bouge pas. Quelqu'un peut-il expliquer pourquoi je me trompe ou comment je peux expliquer cela au professeur?


Il y a deux hôpitaux nommés Mercy et Hope dans votre ville. Vous devez choisir l'un d'entre eux pour subir une opération. Vous décidez de baser votre décision sur le succès de leurs équipes chirurgicales. Heureusement, dans le cadre du nouveau plan de santé, les hôpitaux fournissent des données sur le succès de leurs opérations, réparties en cinq grandes catégories d'opérations. Supposons que vous obteniez les données suivantes pour les deux hôpitaux:

Mercy Hospital

Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366

Hope Hospital 

Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588

Vous remarquez que, dans tous les types d'opérations, Mercy a un taux de réussite plus élevé que Hope, mais Hope a le taux de réussite global le plus élevé. Quel hôpital choisiriez-vous et pourquoi (choisissez deux réponses)?

A) Miséricorde; puisque j'irais pour une opération spécifique, je veux l'hôpital qui a le meilleur taux de réussite pour cette opération.

B) Espoir; comme ils effectuent moins d'opérations dans toutes les catégories, ils ne sont pas "heureux de l'opération" comme Mercy.

C) Espoir; ceci est un exemple du paradoxe de Simpson et nous devons toujours choisir la conclusion "évidente".

D) Miséricorde; en regardant la colonne E, Mercy fait clairement des chirurgies plus difficiles et est donc probablement un meilleur hôpital.

E) Espoir; il a le meilleur taux de réussite global.

F) Miséricorde; ceci est un exemple du paradoxe de Simpson et nous devons toujours choisir l'opposé de la conclusion "évidente".

swiecki
la source
Oh wow, je suis désolé, tu as tout à fait raison. Je n'ai pas vraiment vu qu'il y avait un site SE pour l'analyse statistique. Merci.
swiecki
Pas besoin d'être désolé. Je vous alertais juste de ce fait au cas où vous pourriez ne pas être au courant. Vous pouvez cliquer sur le lien "drapeau" et simplement demander à y être migré. Cela devrait arriver assez rapidement. (+1) sur la question aussi, soit dit en passant.
Cardinal
Je vais migrer cette question vers le site statistics.SE. Il y aura un lien qui apparaît sous la question ici que vous pouvez suivre vers le nouvel emplacement de votre question. Si vous avez besoin d'aide pour associer un compte à statistics.SE, vous pouvez signaler votre question à l'attention du modérateur, et quelqu'un là-bas vous aidera.
Zev Chonoles

Réponses:

22

Je pense que A et E ne sont pas une bonne combinaison, car A dit que vous devez choisir Mercy et E dit que vous devez choisir Hope.

A et D ont le mérite de préconiser le même choix. Mais, examinons plus en détail le raisonnement en D, car cela semble être la confusion. La probabilité de succès des chirurgies suit le même ordre dans les deux hôpitaux, le type A étant le plus susceptible de réussir et le type E le moins probable. Si nous nous effondrons (c.-à-d. Ignorons) les hôpitaux, nous pouvons voir que la probabilité marginale de succès des chirurgies est:

Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52

Parce que E a beaucoup moins de chances de réussir, il est raisonnable d'imaginer que c'est plus difficile (bien que dans le monde réel, d'autres possibilités existent également). Nous pouvons également étendre cette ligne de pensée aux quatre autres types. Voyons maintenant quelle proportion du total des chirurgies de chaque hôpital est de chaque type:

Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05

Ce que nous remarquons ici, c'est que Hope a tendance à faire plus de chirurgies plus faciles AC (et surtout B & C), et moins de chirurgies plus dures comme D.E est assez rare dans les deux hôpitaux, mais, pour ce que ça vaut, Hope en fait fait un pourcentage plus élevé. Néanmoins, l'effet Paradox de Simpson sera principalement provoqué par BD ici (pas réellement la colonne E comme le choix de réponse D suggéré).

Le Paradoxe de Simpson se produit parce que les chirurgies varient en difficulté (en général) et aussi parce que les N diffèrent. Ce sont les taux de base différents des différents types de chirurgies qui rendent cela contre-intuitif. Ce qui se passe serait facile à voir si les deux hôpitaux pratiquaient exactement le même nombre de chaque type de chirurgie. Nous pouvons le faire en calculant simplement les probabilités de succès et en multipliant par 100; cela s'ajuste pour les différentes fréquences:

Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225

Maintenant, parce que les deux hôpitaux ont fait 100 de chaque chirurgie (500 au total), la réponse est évidente: Mercy est le meilleur hôpital.

gung - Réintégrer Monica
la source
+1 Je jouais avec pbinom dans R pendant que vous répondiez à cette question. :)
Michelle
1
Oh mon cher, en examinant votre réponse, j'ai réalisé que j'ai fait une légère erreur en fournissant des détails: je pense que A) et F) sont la réponse, pas E) car cela ne correspond évidemment pas. Désolé pour ça. Si vous auriez la gentillesse de laisser un autre commentaire ou une réponse à la réponse F), je serais plus qu'heureux de voter positivement et d'accepter cette réponse.
swiecki
2
Donc, le désaccord est qu'il dit A & D, et vous dites A & F, est-ce vrai? Si vous essayez de le convaincre de vous donner des points pour votre réponse de toute façon, vous pourriez dire que la chirurgie E n'est pas le principal moteur de l'effet, comme je le montre ci-dessus. OTOH, F n'est pas vraiment une bonne réponse, il fait appel à une reconnaissance du phénomène sans une solide compréhension de celui-ci. Puisqu'il n'y a que 3 choix qui plaident pour la miséricorde (le bon hôpital) qui quitte A & D. De plus, la chirurgie E fait partie de l'effet même si ce n'est pas la plus grande influence. J'aurais choisi A & D, mais les réponses étaient mal conçues.
gung - Réintégrer Monica
1
+1 C'est à peu près l'explication la plus claire que j'ai eue du paradoxe de Simpson (merci!). Une chose très mineure - dans votre dernier tableau, j'obtiens un résultat légèrement différent pour la dernière colonne, la première ligne ( github.com/RInterested/SIMULATIONS_and_PROOFS/blob/master/… )
Antoni Parellada
1
@gung Ah! Vous parliez donc de pourcentages, pas de nombres entiers?
Grec - Proposition de la zone 51 du
4

Aucune des réponses n'est entièrement sans fondement. Mais ils supposent TOUS des connaissances externes importantes et ne peuvent pas être considérés comme corrects strictement sur la base des statistiques.

A, B, D et E nécessitent tous des hypothèses sur les facteurs qui poussent les patients à choisir un hôpital plutôt qu'un autre; le processus par lequel les médecins et les patients sont jumelés, la mesure dans laquelle les taux de réussite sont attribuables à des classes d'opérations spécifiques par rapport à des facteurs partagés comme les soins intensifs, et ainsi de suite.

Dans le monde réel, nous pourrions légitimement considérer de nombreux facteurs alternatifs tels que les prestataires de paiement que l'hôpital accepte officiellement, les taux socioéconomiques et d'obésité du quartier, qu'il s'agisse d'un hôpital d'enseignement (auquel cas le taux de réussite chute lorsque de nouveaux internes arrivent et nous doivent considérer la composition mensuelle), et ainsi de suite.

Évidemment, nous pouvons et faisons des hypothèses raisonnables sur ces facteurs, mais sans les aborder spécifiquement ou les exclure du problème, il est impossible de dire si une réponse est "correcte" ou non.

Jonathan
la source
3

@gung a donné une réponse très approfondie, mais il y a une autre raison pour laquelle D est une réponse correcte à la question: de meilleurs hôpitaux effectuent plus d'opérations difficiles parce qu'ils sont meilleurs. Autrement dit, si une personne entre à l'hôpital de Hope pour l'opération E (la plus difficile), elle peut l'envoyer à Mercy parce qu'elle ne sait pas comment le faire à Hope.

Cela se produit même dans le monde réel, les cas les plus difficiles étant envoyés dans des hôpitaux plus grands ou plus spécialisés.

Peter Flom - Réintégrer Monica
la source
L'opération E n'est-elle pas la plus difficile dans l'exemple? De plus, dans le problème, nous savons que l'opération E est effectuée à la fois à Hope et à Mercy parce que nous avons des données à leur sujet.
Jarad
E est le plus difficile, mon erreur, mais alors que les deux hôpitaux font tous les deux E, ils ne font pas une proportion égale de E. C'est en partie la raison pour laquelle c'est un paradoxe.
Peter Flom - Réintègre Monica