Quelle est la différence entre la sortie «coef» et «(exp) coef» de coxph dans R?

14

J'ai essayé de discerner ce que signifient exactement les sorties "coef" et "(exp) coef" de coxph. Il semble que les "(exp) coef" soient des comparaisons de la première variable du modèle selon le groupe assigné dans la commande.

Comment la fonction coxph arrive-t-elle aux valeurs de "coef" et "(exp) coef"?

De plus, comment le coxphe détermine-t-il ces valeurs lorsque la censure est impliquée?

annemphillip
la source

Réponses:

21

Si vous avez une seule variable explicative, disons groupe de traitement, un modèle de régression de Cox est équipé coxph(); le coefficient ( coef) se lit comme un coefficient de régression (dans le contexte du modèle de Cox, décrit ci-après) et son exponentielle vous donne le danger dans le groupe de traitement (par rapport au groupe témoin ou placebo). Par exemple, si , alors le danger est , soit 16,5%.β^=1.80exp(1.80)=0.165

Comme vous le savez peut-être, la fonction de danger est modélisée comme

h(t)=h0(t)exp(βx)

où est le risque de base. Les aléas dépendent multiplicativement des covariables, et est le rapport des aléas entre deux individus dont les valeurs de diffèrent d'une unité lorsque toutes les autres covariables sont maintenues constantes. Le rapport des dangers de deux individus et est , et est appelé le hazard ratio (ou taux d'incidence). Ce rapport est supposé constant dans le temps, d'où le nom de danger proportionnel .h0(t)exp(β1)x1ijexp(β(xixj))

Pour faire écho à votre question précédente survreg, ici la forme de n'est pas spécifiée; plus précisément, il s'agit d'un modèle semi-paramétrique en ce que seuls les effets des covariables sont paramétrés, et non la fonction de hasard. En d'autres termes, nous ne faisons aucune hypothèse de distribution sur les temps de survie.h0(t)

Les paramètres de régression sont estimés en maximisant la log-vraisemblance partielle définie par

=flog(exp(βxf)r(f)exp(βxr))

où la première sommation concerne tous les décès ou échecs , et la deuxième sommation concerne tous les sujets encore en vie (mais à risque) au moment de l'échec - c'est ce qu'on appelle l' ensemble de risques . En d'autres termes, peut être interprété comme la vraisemblance du profil de log pour après avoir éliminé (ou en d'autres termes, la LL où les ont été remplacés par des fonctions de qui maximisent la vraisemblance avec par rapport à pour un vecteur fixe ).r ( f ) β h 0 ( t ) h 0 ( t ) β h 0 ( t ) βfr(f)βh0(t)h0(t)βh0(t)β

À propos de la censure, il n'est pas clair si vous faites référence à la censure de gauche (comme cela pourrait être le cas si nous considérons une origine pour l'échelle de temps antérieure au moment où l'observation a commencé, également appelée entrée différée ), ou à la censure de droite. Dans tous les cas, plus de détails sur le calcul des coefficients de régression et la façon dont le package de survie gère la censure peuvent être trouvés dans Therneau et Grambsch, Modelling Survival Data (Springer, 2000). Terry Therneau est l'auteur de l'ancien package S. Un tutoriel en ligne est disponible.

L'analyse de survie dans R , par David Diez, fournit une bonne introduction à l'analyse de survie dans R. Un bref aperçu des tests pour les paramètres de régression est donné p. 10. J'espère que cela devrait aider à clarifier l'aide en ligne citée par @onestop , "coefficients les coefficients du prédicteur linéaire, qui multiplient les colonnes de la matrice du modèle". Pour un manuel appliqué, je recommande l' analyse des données médicales à l'aide de S-PLUS , par Everitt et Rabe-Hesketh (Springer, 2001, chap.16 et 17), dont la plupart des éléments ci-dessus proviennent. Une autre référence utile est l'annexe de John Fox sur la régression des risques proportionnels de Cox pour les données de survie .χ2

chl
la source
4
+1, c'est une réponse vraiment informative à une question assez simple et directe. J'apprécie particulièrement les liens vers les ressources pour plus d'informations. NB le lien vers le tutoriel en ligne de Terry Therneau est mort; Un package d'analyse de survie en S peut être un lien direct vers le même matériel.
gung - Réintégrer Monica
5

Pour citer la documentation de la méthode d'impression d'un objet coxph, obtenue en R en tapant ?survival::print.coxph:

coefficients les coefficients du prédicteur linéaire, qui multiplient les colonnes de la matrice du modèle.

C'est toute la documentation fournie par l'auteur du package. Le package ne contient ni guide d'utilisation ni vignette de package. R n'est pas conçu pour être convivial et la documentation suppose que vous avez déjà compris les méthodes statistiques impliquées.

Je suppose que la coefcolonne donne ce qui précède coefficients, et la exp(coef)colonne est l'exponentielle de ceux-ci. Comme la régression de Cox implique une fonction de lien logarithmique, les coefficients sont les rapports de risque logarithmiques . Les exposer vous redonne donc des aléas.

un arrêt
la source