coxph 命令中时间变换函数的默认值是多少?
What is the default of the time transform function in the coxph command?
简介:
Cox 比例风险 (PH) 模型可以使用 survival
包的 coxph
函数进行估算。从这种类型的模型中获得合理结果的一个明显要求是危害是成比例的,即它们随时间保持不变。如果某个变量不是这种情况,可以通过使该变量的系数随时间变化来解决。 (现在它在技术上是一个扩展的 Cox 模型。)这是通过将 tt()
添加到该变量并随时间指定一个函数来完成的(参见 vignette("timedep", package = "survival")
第 19+ 页)。
问题:
如果不指定函数就使用tt()
,则使用哪个函数?
这是一个例子:
library(survival)
data(lung)
cox_model <- coxph(Surv(time, status) ~ age + sex + ph.karno, data = lung)
cox_model_ph <- cox.zph(cox_model)
# rho chisq p
# age 0.00701 0.00871 0.92566
# sex 0.12249 2.42336 0.11954
# ph.karno 0.23135 8.24167 0.00409
# GLOBAL NA 11.54750 0.00911
我们看到 ph.karno
违反了 PH 假设(小 p 值),所以添加 tt()
:
cox_model_tt <- coxph(Surv(time, status) ~ age + sex + tt(ph.karno), data = lung)
cox_model_tt_ph <- cox.zph(cox_model_tt)
# rho chisq p
# age -0.00907 0.0142 0.9052
# sex 0.12844 2.7270 0.0987
# tt(ph.karno) 0.11643 2.3846 0.1225
# GLOBAL NA 5.0220 0.1702
现在 PH 假设满足了,但我不知道 tt()
函数实际上做了什么。我尝试了一些常用函数,例如 tt = function(x, t, ...) x*t
、tt = function(x, t, ...) x + t
、tt = function(x, t, ...) x*log(t)
。但都给出了不同的结果(并且无法修复 PH 违规)。
感谢任何帮助。
查看 coxph
的代码,我想我是否找到了。您没有为 'tt' 参数提供任何值,所以我认为这会被执行:
if (is.null(tt)) {
tt <- function(x, time, riskset, weights) {
obrien <- function(x) {
r <- rank(x)
(r - 0.5)/(0.5 + length(r) - r)
}
unlist(tapply(x, riskset, obrien))
}
这是一个实验确认:
> cox_model_OB <- coxph(Surv(time, status) ~ age + sex + tt(ph.karno), data = lung, tt= function(x, time, riskset, weights) {
+ obrien <- function(x) {
+ r <- rank(x)
+ (r - 0.5)/(0.5 + length(r) - r)
+ }
+ unlist(tapply(x, riskset, obrien))
+ }
+ )
> ( cox_model_tt_ph <- cox.zph(cox_model_tt) )
rho chisq p
age -0.00907 0.0142 0.9052
sex 0.12844 2.7270 0.0987
tt(ph.karno) 0.11643 2.3846 0.1225
GLOBAL NA 5.0220 0.1702
我想知道这是不是故意的。我怀疑这是开发会话期间留下的代码。我怀疑 Therneau 打算提供一个 'tt' 函数失败应该至少抛出一个警告,但可能更喜欢一个错误。
所以这是一个猜测,我通过搜索小插图发现我错了,发现它是有意的:"This relies on the fact that the input arguments to tt() are ordered by the event number or risk set. This function is used as a default if no tt argument is present in the coxph call, but there are tt terms in the model formula. (Doing so allowed me to depreciate the survobrien function)." 参考:"Using Time Dependent Covariates and Time Dependent Coefficients in the Cox Model" 第 23 页来自当前的生存包索引帮助页面链接到小插图.
简介:
Cox 比例风险 (PH) 模型可以使用 survival
包的 coxph
函数进行估算。从这种类型的模型中获得合理结果的一个明显要求是危害是成比例的,即它们随时间保持不变。如果某个变量不是这种情况,可以通过使该变量的系数随时间变化来解决。 (现在它在技术上是一个扩展的 Cox 模型。)这是通过将 tt()
添加到该变量并随时间指定一个函数来完成的(参见 vignette("timedep", package = "survival")
第 19+ 页)。
问题:
如果不指定函数就使用tt()
,则使用哪个函数?
这是一个例子:
library(survival)
data(lung)
cox_model <- coxph(Surv(time, status) ~ age + sex + ph.karno, data = lung)
cox_model_ph <- cox.zph(cox_model)
# rho chisq p
# age 0.00701 0.00871 0.92566
# sex 0.12249 2.42336 0.11954
# ph.karno 0.23135 8.24167 0.00409
# GLOBAL NA 11.54750 0.00911
我们看到 ph.karno
违反了 PH 假设(小 p 值),所以添加 tt()
:
cox_model_tt <- coxph(Surv(time, status) ~ age + sex + tt(ph.karno), data = lung)
cox_model_tt_ph <- cox.zph(cox_model_tt)
# rho chisq p
# age -0.00907 0.0142 0.9052
# sex 0.12844 2.7270 0.0987
# tt(ph.karno) 0.11643 2.3846 0.1225
# GLOBAL NA 5.0220 0.1702
现在 PH 假设满足了,但我不知道 tt()
函数实际上做了什么。我尝试了一些常用函数,例如 tt = function(x, t, ...) x*t
、tt = function(x, t, ...) x + t
、tt = function(x, t, ...) x*log(t)
。但都给出了不同的结果(并且无法修复 PH 违规)。
感谢任何帮助。
查看 coxph
的代码,我想我是否找到了。您没有为 'tt' 参数提供任何值,所以我认为这会被执行:
if (is.null(tt)) {
tt <- function(x, time, riskset, weights) {
obrien <- function(x) {
r <- rank(x)
(r - 0.5)/(0.5 + length(r) - r)
}
unlist(tapply(x, riskset, obrien))
}
这是一个实验确认:
> cox_model_OB <- coxph(Surv(time, status) ~ age + sex + tt(ph.karno), data = lung, tt= function(x, time, riskset, weights) {
+ obrien <- function(x) {
+ r <- rank(x)
+ (r - 0.5)/(0.5 + length(r) - r)
+ }
+ unlist(tapply(x, riskset, obrien))
+ }
+ )
> ( cox_model_tt_ph <- cox.zph(cox_model_tt) )
rho chisq p
age -0.00907 0.0142 0.9052
sex 0.12844 2.7270 0.0987
tt(ph.karno) 0.11643 2.3846 0.1225
GLOBAL NA 5.0220 0.1702
我想知道这是不是故意的。我怀疑这是开发会话期间留下的代码。我怀疑 Therneau 打算提供一个 'tt' 函数失败应该至少抛出一个警告,但可能更喜欢一个错误。
所以这是一个猜测,我通过搜索小插图发现我错了,发现它是有意的:"This relies on the fact that the input arguments to tt() are ordered by the event number or risk set. This function is used as a default if no tt argument is present in the coxph call, but there are tt terms in the model formula. (Doing so allowed me to depreciate the survobrien function)." 参考:"Using Time Dependent Covariates and Time Dependent Coefficients in the Cox Model" 第 23 页来自当前的生存包索引帮助页面链接到小插图.