Si quelqu'un fait une déclaration comme ci-dessous:
"Dans l'ensemble, les non-fumeurs exposés à la fumée ambiante avaient un risque relatif de maladie coronarienne de 1,25 (intervalle de confiance à 95%, 1,17 à 1,32) par rapport aux non-fumeurs non exposés à la fumée."
Quel est le risque relatif pour l'ensemble de la population? Combien de choses sont liées à la maladie coronarienne? Parmi le grand nombre de choses qui peuvent être testées, très peu sont en réalité liées à une maladie coronarienne, de sorte que la probabilité qu'une chose particulière choisie au hasard soit connectée est extrêmement faible. Ainsi, nous pouvons dire que le risque relatif pour la population est 1. Mais l'intervalle cité ne contient pas la valeur 1. Donc, soit il y a en fait un lien entre les deux choses, dont la probabilité est très faible, soit c'est l'une des les 5% d'intervalles qui ne contiennent pas le paramètre. Comme ce dernier est beaucoup plus probable que le premier, c'est ce que nous devons supposer. Par conséquent, la conclusion appropriée est que l'ensemble de données était presque certainement atypique de la population,
Bien sûr, s'il y a une base pour supposer que plus de 5% des choses sont liées à une maladie coronarienne, alors il pourrait y avoir des preuves dans les statistiques pour soutenir la suggestion que la fumée de l'environnement en fait partie. Le bon sens suggère que cela est peu probable.
Quelle est l'erreur dans leur raisonnement (comme tous les organismes de santé conviennent qu'il existe une littérature importante concernant les effets néfastes du tabagisme passif)? Est-ce à cause de leur prémisse que "Parmi le grand nombre de choses qui peuvent être testées, très peu sont réellement liées aux maladies coronariennes"? Cette phrase peut être vraie pour tout facteur choisi au hasard (c.-à-d. Combien de chiens une personne possède avec le risque de maladie coronarienne), mais la probabilité a priori est beaucoup plus élevée pour le tabagisme passif et les maladies coronariennes que pour «tout facteur aléatoire» .
Est-ce le bon raisonnement? Ou y a-t-il autre chose?
la source
Réponses:
Il y a beaucoup de problèmes ici. Comme l'explique @ Néstor, il suppose implicitement des probabilités antérieures sur (pas de lien) et (lien).H 1H0 H1
Il place un poids très élevé (très proche de 1) sur et un poids très faible sur . C'est la première chose douteuse qu'il fait, puisqu'il existe un lien mécanique entre la fumée et les maladies cardiaques (pensez aux fumeurs actifs), la question est vraiment de savoir si l'exposition est suffisante. Cela ne tient même pas compte des études antérieures effectuées. Ce n'est donc vraiment pas un «grand nombre de choses» à tester comme le serait le port de chaussettes rouges par exemple. Cela signifie qu'il commence déjà avec un précédent très biaisé et pas vraiment justifiable.H 1H0 H1
Il met ensuite à jour son précédent en déclarant que la probabilité d'obtenir un intervalle de confiance à 95% de ne pas contenir la vraie valeur a une probabilité de 5%. Bien que cela soit vrai, ce n'est pas la chance d'obtenir cet intervalle particulier sous l'hypothèse de l'hypothèse nulle . Il est à noter qu'il aurait traité un intervalle de confiance de [1,17, 1,32] exactement comme un intervalle de confiance de [100, 200], ce qui est clairement problématique.
Ceci est vraiment important pour l'approche bayésienne: bien que vous ayez une probabilité totale de 5% de ne pas obtenir un intervalle contenant le 1 sous l'hypothèse que 1 est zéro, la densité de probabilité d'obtenir cet intervalle particulier est différente (et plus petite).
La troisième erreur est qu'il n'a jamais précisé son a priori ni ne précise la probabilité que soit contre pour qu'il obtienne ce résultat. C'est juste "extrêmement petit".H 1H0 H1
La quatrième erreur est de dire que la mesure appropriée à prendre serait de rejeter les données. Notez que son résultat ne dépend même pas des données, son argument implique exactement que la même action aurait été effectuée pour toutes les données. Si vous trouvez un lien intéressant mais que vous pensez qu'il s'agit peut-être simplement d'un coup de chance, la bonne chose scientifique à faire est d'essayer de reproduire votre résultat!
la source
Il s'agit d'une question philosophique assez intéressante liée aux tests d'hypothèses (et donc dans le cadre fréquentiste également les intervalles de confiance, comme je l'explique ici ).
Il y a, bien sûr, beaucoup d'hypothèses qui pourraient être étudiées - le tabagisme passif provoque des maladies coronariennes, la consommation d'alcool cause des chd, la possession de chiens cause des chd, être un Capricorne cause des chd ...
Si nous choisissons une de toutes ces hypothèses au hasard, la probabilité que nous choisissions une hypothèse qui se trouve être vraie est pratiquement nulle. Cela semble être l'argument du texte cité - qu'il est très peu probable que nous ayons testé une véritable hypothèse.
Mais l'hypothèse n'a pas été choisie au hasard. Elle était motivée par des connaissances épidémiologiques et médicales antérieures sur les maladies coronariennes. Il existe des mécanismes théoriques qui expliquent comment le tabagisme peut provoquer des maladies coronariennes, il ne semble donc pas exagéré de penser que ceux-ci fonctionneraient également pour le tabagisme passif.
La critique dans la citation peut être valable pour les études exploratoires où un ensemble de données est extrait pour des hypothèses. C'est la raison pour laquelle nous n'acceptons pas ces "découvertes" comme des faits - au lieu de cela, nous exigeons que les résultats puissent être reproduits dans de nouvelles études. Quoi qu'il en soit, l'article cité dans la citation est une méta-étude et n'est donc pas affecté par ce problème.
Nous avons vu empiriquement au cours des derniers siècles que le test d'hypothèses motivées par la théorie en comparant les résultats prévus aux résultats observés fonctionne. Le fait que nous croyons en cette procédure est la raison pour laquelle nous avons fait tant de progrès en médecine, en ingénierie et en science. C'est la raison pour laquelle je peux écrire ceci sur mon ordinateur et que vous pouvez le lire sur le vôtre. Faire valoir que cette procédure est erronée, c'est faire valoir que la méthode scientifique est fondamentalement viciée - et nous avons beaucoup de preuves qui disent le contraire.
Je doute qu'il y ait quoi que ce soit qu'une personne qui n'est pas disposée à accepter ce genre de preuves accepte réellement ...
la source
Je ne comprends vraiment pas pourquoi l'auteur dit que la probabilité que le risque relatif de maladie coronarienne soit de 1 pourrait être très faible en fondant son analyse uniquement sur un intervalle de confiance; c'est tout à fait faux. Pour moi, il semble qu'il utilise un cadre fréquentiste, mais il raisonne de façon bayésienne (ce qui est assez courant).
la source
Bien qu'il y ait quelque chose dans ce raisonnement bayésien (déconstruit très en détail par Erik!), Et en effet, ce raisonnement expliquerait pourquoi de nombreuses découvertes médicales ne peuvent pas être reproduites, cet argument particulier applique cette pensée comme un marteau.
L'auteur présuppose deux choses sans apporter de preuves: que l'exposition à la fumée a été choisie au hasard et que presque rien au monde ne cause de maladie cardiaque. En vertu de ces normes de raisonnement laxistes, l'auteur pourrait rejeter TOUTE conclusion que quelque chose cause une maladie cardiaque. Il vous suffirait d'affirmer:
Ces deux affirmations sont discutables (et, sur la base de mes connaissances générales, très probablement fausses). Mais, avec ces hypothèses en place, même en observant que 100% des personnes exposées à la fumée secondaire sont mortes d'une crise cardiaque en un an, vous pouvez affirmer que la connexion n'est qu'une coïncidence corrélative avec la cause cachée, singulière et "vraie". .
la source
Je ne vois rien de mal à l'évidence dans le paragraphe entre guillemets, mais je n'ai pas vu les données et je ne peux pas vérifier ses chiffres. Cependant, les deux paragraphes qui suivent ne sont pas très clairs.
Supposons qu'il ait dit: "Dans l'ensemble, les non-fumeurs qui étaient obèses morbides avaient un risque relatif de maladie coronarienne de 1,25 (intervalle de confiance à 95%, 1,17 à 1,32) par rapport aux non-fumeurs qui avaient un poids corporel normal." Quelqu'un aurait-il des raisons de douter de lui?
la source