L'autre jour, j'ai eu une consultation avec un épidémiologiste. Elle est MD avec un diplôme en santé publique en épidémiologie et possède beaucoup de connaissances statistiques. Elle encadre ses chercheurs et résidents et les aide à résoudre des problèmes statistiques. Elle comprend assez bien les tests d'hypothèses. Elle avait un problème typique de comparer deux groupes pour voir s'il y avait une différence dans le risque lié à une insuffisance cardiaque congestive (CHF). Elle a testé la différence moyenne dans la proportion de sujets recevant une CHF. La valeur de p était de 0,08. Ensuite, elle a également décidé d'examiner le risque relatif et a obtenu une valeur de p de 0,027. Elle a donc demandé pourquoi l'un est important et l'autre non. En examinant des intervalles de confiance bilatéraux à 95% pour la différence et pour le rapport, elle a vu que l'intervalle de différence moyenne contenait 0 mais la limite de confiance supérieure pour le rapport était inférieure à 1. Alors, pourquoi obtenons-nous des résultats incohérents. Ma réponse, bien que techniquement correcte, n'était pas très satisfaisante. J'ai dit: «Ce sont des statistiques différentes et peuvent donner des résultats différents. Les valeurs de p sont toutes deux dans le domaine de marginalement significatives. Cela peut facilement se produire. Je pense qu'il doit y avoir de meilleures façons de répondre en termes simples aux médecins pour les aider à comprendre la différence entre tester le risque relatif et le risque absolu. Dans les études d'épi, ce problème se pose souvent car ils examinent souvent des événements rares où les taux d'incidence pour les deux groupes sont très faibles et les tailles d'échantillon ne sont pas très grandes. J'y ai réfléchi un peu et j'ai quelques idées que je partagerai. Mais j'aimerais d'abord savoir comment certains d'entre vous géreraient cela. Je sais que beaucoup d'entre vous travaillent ou consultent dans le domaine médical et ont probablement fait face à ce problème. Qu'est-ce que tu ferais?
la source
Réponses:
Eh bien, d'après ce que vous avez déjà dit, je pense que vous avez couvert l'essentiel de la question, mais il suffit de le mettre dans sa langue: l'un est une différence de risques, l'autre est un rapport. Ainsi, un test d'hypothèse demande si tandis que l'autre demande si . Parfois, ce sont "proches", parfois non. (Fermez entre guillemets parce qu'ils ne sont clairement pas proches au sens arithmétique habituel). Si le risque est rare, ceux-ci sont généralement «très éloignés». par exemple (loin de 1) tandis que (près de 0); mais si le risque est élevé, ils sont alors "proches": (loin de 0) et (également loin de 0, du moins par rapport au cas rare.p 2p2- p1= 0 .002/.001=2.002-.001=.001.2/.1=2.2-.1=.1p2p1= 1 .002 / .001 = 2 .002 - .001 = .001 .2 / .1 = 2 .2 - .1 = .1
la source
N'oubliez pas que dans les deux tests, vous testez une hypothèse complètement différente avec des hypothèses différentes. Les résultats ne sont pas comparables, et c'est une erreur beaucoup trop courante.
Dans le risque absolu, vous testez si la différence (moyenne) de proportion diffère considérablement de zéro. L'hypothèse sous-jacente dans le test standard pour cela suppose que les différences de proportion sont normalement distribuées. Cela peut tenir pour de petites proportions, mais pas pour de grandes. Techniquement, vous calculez la probabilité conditionnelle suivante:
ce qui revient à tester la pente dans le modèle logistique suivant:
La raison pour laquelle cela fait une différence est donnée dans la réponse de Peter Flom: une petite différence dans les risques absolus peut conduire à une grande valeur pour les cotes. Donc, dans votre cas, cela signifie que la proportion de personnes atteintes de la maladie ne diffère pas considérablement, mais les chances d'être dans un groupe sont considérablement plus élevées que les chances d'être dans l'autre groupe. C'est parfaitement sensé.
la source
prop.test
(ouchisq.test
comme c'est équivalent dans le cas 2x2) etfisher.test
être à plus de 0,005 d'intervalle. Je me demande donc quels tests elle a utilisés ...