加速故障时间建模:使用 CI-s 绘制生存概率(提供示例)
Accelerated Failure Time modelling: plotting survival probabilities with CI-s (example provided)
由于我的真实数据违反了比例风险假设,我正在使用 AFT 模型,试图为感兴趣的研究组计算调整后的生存概率。下面的例子是在 kidney data and I tried to follow ciTools vignette.
library(tidyverse)
library(ciTools)
library(here)
library(survival)
library(survminer)
#data
kidney
型号
fit1 = survreg(Surv(time, censored) ~ sex + age + disease, data = kidney)
Call:
survreg(formula = Surv(time, censored) ~ sex + age + disease,
data = kidney)
Coefficients:
(Intercept) sexfemale age diseaseGN diseaseAN diseasePKD
8.41830937 -0.93959839 -0.01578812 -0.25274448 -0.38306425 -0.32830433
Scale= 1.642239
Loglik(model)= -122.1 Loglik(intercept only)= -122.7
Chisq= 1.33 on 5 degrees of freedom, p= 0.931
n= 76
添加男女至少存活 365 天的存活概率
probs = ciTools::add_probs(kidney, fit1, q = 365,
name = c("prob", "lcb", "ucb"),
comparison = ">")
probs
试图绘制男女的一年生存概率,但有多个点估计 geom_point?
在我看来,这些点估计值是针对每个 age 值给出的。我可以编辑预测,使其针对平均年龄或中位年龄吗?
probs %>% ggplot(aes(x = prob, y = sex)) +
ggtitle("1-year survival probability") +
xlim(c(0,1)) +
theme_bw() +
geom_point(aes(x = prob), alpha = 0.5, colour = "red")+
geom_linerange(aes(xmin = lcb, xmax = ucb), alpha = 0.5)
但是,这种方法似乎适用于简单的模型
fit2 = survreg(Surv(time, censored) ~ sex, data = kidney)
probs2 = ciTools::add_probs(kidney, fit2, q = 365,
name = c("prob", "lcb", "ucb"),
comparison = ">")
probs2 %>% ggplot(aes(x = prob, y = sex)) +
ggtitle("1-year survival probability") +
xlim(c(0,1)) +
theme_bw() +
geom_point(aes(x = prob), alpha = 0.5, colour = "red")+
geom_linerange(aes(xmin = lcb, xmax = ucb), alpha = 0.5)
问题:
- 如何调整男女的生存概率?或者,如果这是不可能的,那么可能的替代方案是什么?代码将有助于替代方案。
- 如果我想获得针对男女和不同时间点的调整生存概率,我应该在 ciTools::add_probs() 函数中编辑“q”值吗?例如:q = 30 表示一个月; q = 90 三个月等。或者我应该 运行 每个时间段的单独模型?
根据您设置这些模型的方式,将根据模型中包含的协变量值为 kidney
数据集中的每个人返回预测。
在您的第一个模型中,您包含了 sex + age + disease
,这样您就可以预测数据集中这 3 个协变量值的每个组合。
在第二个模型中,您只包含 sex
作为预测变量,因此您只能得到基于性别的预测。
生存模型预测函数允许您指定一组协变量值,根据这些值在新数据框中进行预测。根据 manual for add_probs.survreg
,您可以通过在函数的 df
参数中指定一个具有指定协变量值的新数据框来实现。你在那里使用了 kidney
数据框,所以你得到了所有这些情况的预测。
我不熟悉 ciTools::add_probs
具体来说,但此类软件通常会(没有警告)接受您指定的协变量的值,然后对您指定的协变量使用某种类型的“平均”值不指定。由于“平均值”对于像 disease
这样的分类协变量没有太大意义,通常最好自己为所有协变量指定一组完整有用的值。
rms package
in R 中的函数通常在提供有用的预测方面做得更好,因为它们根据 datadist()
函数,然后将其输出指定为系统选项。此软件包的学习曲线有点陡峭,但如果您要进行大量生存或其他回归建模,则非常值得。
由于我的真实数据违反了比例风险假设,我正在使用 AFT 模型,试图为感兴趣的研究组计算调整后的生存概率。下面的例子是在 kidney data and I tried to follow ciTools vignette.
library(tidyverse)
library(ciTools)
library(here)
library(survival)
library(survminer)
#data
kidney
型号
fit1 = survreg(Surv(time, censored) ~ sex + age + disease, data = kidney)
Call:
survreg(formula = Surv(time, censored) ~ sex + age + disease,
data = kidney)
Coefficients:
(Intercept) sexfemale age diseaseGN diseaseAN diseasePKD
8.41830937 -0.93959839 -0.01578812 -0.25274448 -0.38306425 -0.32830433
Scale= 1.642239
Loglik(model)= -122.1 Loglik(intercept only)= -122.7
Chisq= 1.33 on 5 degrees of freedom, p= 0.931
n= 76
添加男女至少存活 365 天的存活概率
probs = ciTools::add_probs(kidney, fit1, q = 365,
name = c("prob", "lcb", "ucb"),
comparison = ">")
probs
试图绘制男女的一年生存概率,但有多个点估计 geom_point?
在我看来,这些点估计值是针对每个 age 值给出的。我可以编辑预测,使其针对平均年龄或中位年龄吗?
probs %>% ggplot(aes(x = prob, y = sex)) +
ggtitle("1-year survival probability") +
xlim(c(0,1)) +
theme_bw() +
geom_point(aes(x = prob), alpha = 0.5, colour = "red")+
geom_linerange(aes(xmin = lcb, xmax = ucb), alpha = 0.5)
但是,这种方法似乎适用于简单的模型
fit2 = survreg(Surv(time, censored) ~ sex, data = kidney)
probs2 = ciTools::add_probs(kidney, fit2, q = 365,
name = c("prob", "lcb", "ucb"),
comparison = ">")
probs2 %>% ggplot(aes(x = prob, y = sex)) +
ggtitle("1-year survival probability") +
xlim(c(0,1)) +
theme_bw() +
geom_point(aes(x = prob), alpha = 0.5, colour = "red")+
geom_linerange(aes(xmin = lcb, xmax = ucb), alpha = 0.5)
问题:
- 如何调整男女的生存概率?或者,如果这是不可能的,那么可能的替代方案是什么?代码将有助于替代方案。
- 如果我想获得针对男女和不同时间点的调整生存概率,我应该在 ciTools::add_probs() 函数中编辑“q”值吗?例如:q = 30 表示一个月; q = 90 三个月等。或者我应该 运行 每个时间段的单独模型?
根据您设置这些模型的方式,将根据模型中包含的协变量值为 kidney
数据集中的每个人返回预测。
在您的第一个模型中,您包含了 sex + age + disease
,这样您就可以预测数据集中这 3 个协变量值的每个组合。
在第二个模型中,您只包含 sex
作为预测变量,因此您只能得到基于性别的预测。
生存模型预测函数允许您指定一组协变量值,根据这些值在新数据框中进行预测。根据 manual for add_probs.survreg
,您可以通过在函数的 df
参数中指定一个具有指定协变量值的新数据框来实现。你在那里使用了 kidney
数据框,所以你得到了所有这些情况的预测。
我不熟悉 ciTools::add_probs
具体来说,但此类软件通常会(没有警告)接受您指定的协变量的值,然后对您指定的协变量使用某种类型的“平均”值不指定。由于“平均值”对于像 disease
这样的分类协变量没有太大意义,通常最好自己为所有协变量指定一组完整有用的值。
rms package
in R 中的函数通常在提供有用的预测方面做得更好,因为它们根据 datadist()
函数,然后将其输出指定为系统选项。此软件包的学习曲线有点陡峭,但如果您要进行大量生存或其他回归建模,则非常值得。