Quelle est la valeur «

18

Quelle est la valeur donnée dans le résumé d'un modèle coxph dans R? Par exemple,R2

Rsquare= 0.186   (max possible= 0.991 )

Je l'ai insensément inclus un manuscrit en tant que valeur et le critique a sauté dessus en disant qu'il n'était pas au courant d'un analogue de la statistique de la régression linéaire classique développée pour le modèle de Cox et s'il y en avait une s'il vous plaît fournir une référence. Toute aide est la bienvenue!R2R2

danielsbrewer
la source
1
Dans la plupart des situations où le concept de s'étend au-delà de la régression linéaire classique, il s'agit de la corrélation quadratique entre les valeurs observées et celles prédites par le modèle. Cela pourrait-il être applicable ici? R2
Macro
2
Non, ce n'est pas lié à cela.
Frank Harrell

Réponses:

15

En utilisant, getS3method("summary","coxph")vous pouvez voir comment il est calculé.

Les lignes de code pertinentes sont les suivantes:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Voici cox$loglik«un vecteur de longueur 2 contenant la log-vraisemblance avec les valeurs initiales et avec les valeurs finales des coefficients» (voir ?coxph.object) et cox$nest «nombre d'observations utilisées dans l'ajustement».

Roland
la source
5
Si je ne me trompe pas, c'est le pseudo R-carré de Cox & Snell. Pour l'explication et la comparaison de divers pseudo-carrés au carré, voir ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm .
onestop
4

ncoxph

Ronghui Xu
la source
4
Incorrect, vous divisez par le nombre d'observations, aussi étrange que cela puisse paraître. À la question initiale, il est étrange qu'un critique ne soit pas au courant de quelque chose qui existe depuis 20 ans pour le modèle Cox.
Frank Harrell
Ajoutant à l'échange entre Ronghui Xu et @Frank Harrell, non seulement cela `` semble étrange '' divisé par le nombre d'observations, mais cela ne fonctionne pas. Pour voir cela, considérons le bêta fixé à une certaine valeur de sorte que, grosso modo, E (R2) = 0,5, et la même distribution covariable, c'est-à-dire tout est identique, à part le fait que l'étude 1 a deux fois le taux de censure comme l'étude 2 Bien que nous devrions estimer la même quantité de population, les estimations R2 dans l'étude 1 seront environ la moitié de celles de l'étude 2, quelle que soit la taille de l'échantillon. Au lieu de 0,5, nous obtiendrions environ 0,25.
R2
En réponse à la remarque de Frank, je conviens que ce n'est pas simple et que l'observation de Frank concernant la log-vraisemblance nulle est correcte. Je n'ai jamais considéré cette quantité que comme une approximation d'un estimateur cohérent d'une quantité de population bien définie basée sur le gain d'informations. L'article mentionné par Ronghui Xu effectue des simulations. Ceux-ci montrent que l'impact de la censure, bien qu'il ne soit pas absent, est beaucoup plus faible lorsque nous divisons par le nombre d'échecs plutôt que par le nombre total d'observations.
1
R2