Une façon de résumer la comparaison de deux courbes de survie est de calculer le rapport de risque (HR). Il existe (au moins) deux méthodes pour calculer cette valeur.
- Méthode Logrank. Dans le cadre des calculs de Kaplan-Meier, calculer le nombre d'événements observés (décès, généralement) dans chaque groupe ( et ) et le nombre d'événements attendus en supposant une hypothèse nulle de différence de survie ( et ). Le rapport de risque est alors:
- Méthode Mantel-Haenszel. Calculez d'abord V, qui est la somme des variances hypergéométriques à chaque instant. Ensuite, calculez le rapport de risque comme:
J'ai obtenu ces deux équations du chapitre 3 de Machin, Cheung et Parmar, Survival Analysis . Ce livre déclare que les deux méthodes donnent généralement des méthodes très similaires, et en fait c'est le cas avec l'exemple du livre.
Quelqu'un m'a envoyé un exemple où les deux méthodes diffèrent d'un facteur trois. Dans cet exemple particulier, il est évident que l'estimation du logrank est raisonnable, et l'estimation de Mantel-Haenszel est loin. Ma question est de savoir si quelqu'un a des conseils généraux pour savoir quand il est préférable de choisir l'estimation du logrank du rapport de risque, et quand il est préférable de choisir l'estimation de Mantel-Haenszel? Cela a-t-il à voir avec la taille de l'échantillon? Nombre de liens? Ratio de la taille des échantillons?
Réponses:
Je pense que j'ai trouvé la réponse (à ma propre question). Si l'hypothèse de risques proportionnels est vraie, les deux méthodes donnent des estimations similaires du rapport de risques. L'écart que j'ai trouvé dans un exemple particulier, je pense maintenant, est dû au fait que cette hypothèse est douteuse.
Si l'hypothèse de risques proportionnels est vraie, alors un graphique de log (temps) par rapport à log (-log (St)) (où St est la survie proportionnelle au temps t) devrait montrer deux lignes parallèles. Voici le graphique créé à partir de l'ensemble de données de problème. Cela semble loin d'être linéaire. Si l'hypothèse de risques proportionnels n'est pas valide, le concept de rapport de risque n'a pas de sens, et peu importe la méthode utilisée pour calculer le rapport de risque.
Je me demande si l'écart entre les estimations du logrank et de Mantel-Haenszel du rapport de risque peut être utilisé comme méthode pour tester l'hypothèse de risques proportionnels?
la source
Si je ne me trompe pas, l'estimateur de log-rank auquel vous faites référence est également connu sous le nom d'estimateur de Pike. Je crois qu'il est généralement recommandé pour HR <3 car il présente moins de biais dans cette plage. Le document suivant peut être intéressant (notez que le document y fait référence comme O / E):
la source
Il existe en fait plusieurs autres méthodes et le choix dépend souvent de savoir si vous êtes le plus intéressé par la recherche de différences précoces, de différences ultérieures ou - comme pour le test de log-rank et le test de Mantel-Haenszel - accordez un poids égal à tous les points dans le temps.
Pour la question à portée de main. Le test du log-rank est en fait une forme du test de Mantel-Haenszel appliqué aux données de survie. Le test de Mantel-Haenszel est généralement utilisé pour tester l'indépendance dans les tableaux de contingence stratifiés.
Si nous essayons d'appliquer le test MH aux données de survie, nous pouvons commencer en supposant que les événements à chaque moment de défaillance sont indépendants. Nous stratifions ensuite par temps d'échec. Nous utilisons les méthodes MH pour faire de chaque temps d'échec une strate. Sans surprise, ils donnent souvent le même résultat.
L'exception se produit lorsque plusieurs événements se produisent simultanément - plusieurs décès exactement au même moment. Je ne me souviens pas en quoi le traitement diffère alors. Je pense que le test du log-rank fait la moyenne des ordonnances possibles des temps d'échec liés.
Ainsi, le test de log-rank est le test MH pour les données de survie et peut traiter les liens. Je n'ai jamais utilisé le test MH pour les données de survie.
la source
Je pensais que je suis tombé sur un site Web et une référence qui traite exactement de cette question:
http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Commencez par "Les deux méthodes comparées".
Le site fait référence aux articles de Berstein liés (ci-dessus):
http://www.jstor.org/stable/2530564?seq=1
Le site résume bien les résultats de Berstein et al, je vais donc le citer:
Le site fait également référence à l'ensemble de données dans lequel "les deux estimations de HR étaient très différentes (par un facteur de trois)", et suggèrent que l'hypothèse de PH est une considération clé.
Puis j'ai pensé: "Qui est l'auteur du site?" Après quelques recherches, j'ai trouvé que c'était Harvey Motulsky. Harvey, j'ai réussi à vous référencer en répondant à votre propre question. Vous êtes devenu l'autorité!
Le «jeu de données problématique» est-il un jeu de données accessible au public?
la source