Modèle de risque proportionnel de Cox et interprétation des coefficients lorsqu'une interaction avec des cas plus élevés est impliquée

9

Voici le résumé-sortie du modèle de Coxph que j'ai utilisé (j'ai utilisé R et la sortie est basée sur le meilleur modèle final, c'est-à-dire que toutes les variables explicatives significatives et leurs interactions sont incluses):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

La question est:

Comment interpréter les valeurs de coefficient et exp (coef) dans ce cas, car ce sont de très grandes valeurs? Une interaction à 3 cas est également impliquée, ce qui rend l'interprétation plus confuse.

Tous les exemples concernant le modèle de Coxph que j'ai trouvés jusqu'à présent en ligne ont été très simples en ce qui concerne les termes d'interconnexion (qui se sont toujours révélés non significatifs) ainsi que les valeurs de coefficient (= taux de risque) et les exponentielles de ces derniers (= rapports de risque) ont été des nombres assez petits et "faciles à manipuler", par exemple coefficient = 1,73 -> exp (coef) = 5,64. MAIS les miens sont bien plus grands que vous pouvez le voir dans la sortie récapitulative (ci-dessus). Et parce que ce sont de si grands vaues, ils semblent presque n'avoir aucun sens.

Il semble un peu ridicule de penser que la survie est par exemple 8,815e + 34 (rapport de risque tiré de l'interaction LT: Food: Temp2) fois plus faible lorsque l'interaction augmente d'une unité (?).

En fait, je ne sais pas non plus comment interpréter cette interaction à 3 cas. Cela signifie-t-il que lorsque toutes les variables d'interaction augmentent d'une unité, la survie diminue d'une certaine quantité (exprimée par la valeur exp (coef))?

Ce serait génial si quelqu'un pouvait m'aider ici. :)

Vous trouverez ci-dessous la partie de ma fiche technique que j'ai utilisée pour l'analyse cox. Ici, vous pouvez voir que j'ai utilisé plusieurs fois la même valeur explicative de variabe (c.-à-d. LT, Food et Temp2) pour plusieurs "Time, Status response variable". Ces valeurs de variables explicatives sont déjà les valeurs moyennes de ces variables (en raison de la configuration du travail sur le terrain dans la nature, il n'a pas été possible d'obtenir une valeur de variable explicative individuelle pour chaque individu de réponse observée, d'où les valeurs moyennes déjà utilisées dans cette phase ), ce qui répondrait à la suggestion 1 (?) (voir la première réponse).

Suggestion 2 (voir la 1ère réponse): j'utilise R, et je n'y suis pas encore super dieu. :) Ainsi, si j'utilise la fonction prédire (cox.model, type = "attendu"), j'obtiens une énorme quantité de valeurs différentes et je n'ai aucune idée de la variable explicative à laquelle elles se réfèrent et dans quel ordre. Ou est-il possible de mettre en évidence certains termes d'interaction dans la fonction de prédiction? Je ne sais pas si je me fais très clair ici.

Suggestion 3 (voir 1ère réponse): dans la partie de la fiche technique ci-dessous, on peut voir les unités des différentes variables explicatives. Ils sont tous différents et comprennent des décimales. Cela peut-il avoir quelque chose à voir avec le résultat cox?

Partie de la fiche technique:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

À la vôtre, Unna

Unna
la source
@MansT: Ravi que vous ayez édité la question ;-)
ocram

Réponses:

7

Quelques suggestions, pas directement liées à CoxPH mais aux interactions et à la colinéarité

1) Lorsque vous obtenez des valeurs "folles" comme celles-ci, une possibilité est la colinéarité. C'est souvent un problème lorsque vous avez des interactions. Avez-vous centré toutes vos variables (en soustrayant la moyenne de chacune)?

2) Vous ne pouvez pas interpréter une interaction entre plusieurs aussi facilement. LT, food et temp2 sont tous impliqués dans de nombreuses interactions. Alors, regardez les valeurs prédites de différentes combinaisons.

3) Vérifiez les unités des différentes variables. Lorsque vous obtenez des paramètres fous, c'est parfois un problème d'unités (par exemple, mesurer une taille humaine en millimètres ou en kilomètres)

4) Une fois que vous avez réglé ces choses, je trouve que la façon la plus simple de penser aux effets des différentes interactions (en particulier celles de niveau supérieur) est de représenter graphiquement les valeurs prédites avec différentes combinaisons de valeurs indépendantes.

Peter Flom
la source
Hei, ci-dessous est la partie de ma fiche technique que j'ai utilisée pour l'analyse cox. Ici, vous pouvez voir que j'ai utilisé plusieurs fois la même valeur de variable explicative (c'est-à-dire LT, Food et Temp2) pour plusieurs variables de réponse Time, Status. Ces valeurs de variables explicatives sont déjà les valeurs moyennes de ces variables (en raison de la configuration du travail sur le terrain dans la nature, il n'a pas été possible d'obtenir une valeur de variable explicative individuelle pour chaque individu de réponse observée, d'où les valeurs moyennes déjà utilisées dans cette phase ), ce qui répondrait à la suggestion 1 (?).
Unna
Suggestion 2: J'utilise R, et je n'y suis pas encore super dieu. :) Ainsi, si j'utilise la fonction prédire (cox.model, type = "attendu"), j'obtiens une énorme quantité de valeurs différentes et je n'ai aucune idée de la variable explicative à laquelle elles se réfèrent et dans quel ordre. Ou est-il possible de mettre en évidence certains termes d'interaction dans la fonction de prédiction? Je ne sais pas si je me fais très clair ici.
Unna
Suggestion 3: dans la partie de la fiche technique ci-dessous, on peut voir les unités des différentes variables explicatives. Ils sont tous différents et comprennent des décimales. Cela peut-il avoir quelque chose à voir avec le résultat cox?
Unna
Temps (jours) Statut LT (h) Aliments (portions par jour) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0 14,42 4,46 3,049 9 1 14,42 4,46 3,049 24 0 15,33 4,45 2,595 24 0 15,33 4,45 2,595 19 1 15,33 4,45 2,595
Unna
Le commentaire ci-dessus sur l'exemple de feuille de données que j'ai utilisé ne s'affiche pas sous la forme d'un tableau, mais j'espère qu'il est possible de le comprendre. :)
Unna