Le logarithme estimé du rapport de risque est approximativement distribué normalement

8

Selon ce document : Le logarithme estimé du rapport de risque est approximativement normalement distribué avec une variance (1 / d1) + (1 / d2), où d1 et d2 sont les nombres d'événements dans les deux groupes de traitement.

Avez-vous une référence pour cette déclaration? Ou au moins pouvez-vous me dire quel estimateur est utilisé?

Merci d'avance, Marco

ocram
la source

Réponses:

9

Le fait que ceci soit approximativement distribué normalement dépend du théorème de la limite centrale (CLT), ce sera donc une meilleure approximation dans les grands échantillons. Le CLT fonctionne mieux pour le log de n'importe quel ratio (rapport de risque, odds ratio, hazard ratio ..) que pour le ratio lui-même.

Dans des échantillons suffisamment grands, je pense que c'est une bonne approximation de la variance dans deux situations:

  1. Le danger dans chaque groupe est constant dans le temps (quel que soit le rapport de risque)
  2. L'hypothèse des risques proportionnels est vraie et le rapport des risques est proche de 1

Je pense que cela peut devenir une hypothèse assez grossière dans des situations éloignées de celles-ci, c'est-à-dire si les risques varient considérablement au fil du temps et que le rapport de risques est loin de 1. Que vous puissiez faire mieux dépend des informations disponibles. Si vous avez accès à toutes les données, vous pouvez adapter un modèle de risques proportionnels et obtenir la variance du log ratio de risques à partir de cela. Si vous n'avez que les informations dans un article publié, diverses autres approximations ont été développées par des méta-analystes. Ces deux références sont extraites du manuel Cochrane :

  1. MKB Parmar, V. Torri et L. Stewart (1998). "Extraction de statistiques sommaires pour effectuer des méta-analyses de la littérature publiée pour les critères de survie." Statistiques en médecine 17 (24): 2815-2834.
  2. Paula R. Williamson, Catrin Tudur Smith, Jane L. Hutton et Anthony G. Marson. "Méta-analyse de données agrégées avec des résultats de temps-à-événement" . Statistics in Medicine 21 (22): 3337-3351, 2002.

Dans Parmar et al, l'expression que vous donnez découlerait de l'utilisation de nombres observés à la place de ceux attendus dans leur équation (5), ou de la combinaison des équations (6) et (12). Les équations (5) et (6) sont basées sur des méthodes de logrank . Ils font référence à Kalbfleisch & Prentice pour l'équation (12) mais je n'ai pas cela à portée de main, alors peut-être que quelqu'un qui le voudrait pourrait le vérifier et l'ajouter.

un arrêt
la source