模拟竞争风险数据
Simulate competing risk data
我的目标是模拟可用于测试竞争风险的数据集
模型。我只是用 survsim::crisk.sim
函数尝试一个简单的例子,但是
它不会导致我期望的结果。
require(survival)
simulated_data <- survsim::crisk.sim(n = 100,
foltime = 200,
dist.ev = rep("weibull", 2),
anc.ev = c(0.8, 0.9),
beta0.ev = c(2, 4),
anc.cens = 1,
beta0.cens = 5,
nsit = 2)
model <- survreg(Surv(time, status) ~ 1 + strata(cause), data = simulated_data)
exp(model$scale)
## cause=1 cause=2
## 4.407839 2.576357
我希望这些数字与 beta0.ev
相同。任何指向什么的指针
我可能会做错或其他如何模拟竞争风险数据的建议。
完成:我希望模拟数据中的事件发生在每个风险不同的 Weibull 分布之后。我希望能够在数据中指定一个层次和集群。检查可以遵循 Weibull 或 Bernouli 分布。
要恢复指定的估计值,您可以使用 survreg
和特定原因的符号。
此示例使用您的参数,但为了更精确地估计更多患者:
set.seed(101)
stack_data <- survsim::crisk.sim(n = 2000,
foltime = 200,
dist.ev = rep("weibull", 2),
anc.ev = c(0.8, 0.9),
beta0.ev = c(2, 4),
anc.cens = 1,
beta0.cens = 5,
nsit = 2)
m1 <- survreg(Surv(time, cause==1) ~ 1, data =stack_data, dist = "weibull")
m2 <- survreg(Surv(time, cause==2) ~ 1, data = stack_data, dist = "weibull")
m1$coefficients
这将接近 beta0.ev 原因 1
m2$coefficients
这将接近 beta0.ev 原因 2
> m1$coefficients
(Intercept)
1.976449
> m2$coefficients
(Intercept)
3.995716
m1$scale
这将接近 anc.ev 原因 1
m2$scale
这将接近 anc.ev 原因 2
> m1$scale
[1] 0.8088574
> m2$scale
[1] 0.8923334
不幸的是,这仅适用于统一审查或低非统一审查(例如在您的示例中)
如果我们增加审查的风险,则截距不代表 beta0.ev 参数
set.seed(101)
stack_data <- survsim::crisk.sim(n = 2000,
foltime = 200,
dist.ev = rep("weibull", 2),
anc.ev = c(0.8, 0.9),
beta0.ev = c(2, 4),
anc.cens = 1,
beta0.cens = 2, #reduced from 5, increasing the hazard function for censoring rate
nsit = 2)
m1 <- survreg(Surv(time, cause==1) ~ 1, data =stack_data, dist = "weibull")
m2 <- survreg(Surv(time, cause==2) ~ 1, data = stack_data, dist = "weibull")
> m1$coefficients
(Intercept)
1.531818
> m2$coefficients
(Intercept)
3.553687
>
> m1$scale
[1] 0.8139497
> m2$scale
[1] 0.8910465
我的目标是模拟可用于测试竞争风险的数据集
模型。我只是用 survsim::crisk.sim
函数尝试一个简单的例子,但是
它不会导致我期望的结果。
require(survival)
simulated_data <- survsim::crisk.sim(n = 100,
foltime = 200,
dist.ev = rep("weibull", 2),
anc.ev = c(0.8, 0.9),
beta0.ev = c(2, 4),
anc.cens = 1,
beta0.cens = 5,
nsit = 2)
model <- survreg(Surv(time, status) ~ 1 + strata(cause), data = simulated_data)
exp(model$scale)
## cause=1 cause=2
## 4.407839 2.576357
我希望这些数字与 beta0.ev
相同。任何指向什么的指针
我可能会做错或其他如何模拟竞争风险数据的建议。
完成:我希望模拟数据中的事件发生在每个风险不同的 Weibull 分布之后。我希望能够在数据中指定一个层次和集群。检查可以遵循 Weibull 或 Bernouli 分布。
要恢复指定的估计值,您可以使用 survreg
和特定原因的符号。
此示例使用您的参数,但为了更精确地估计更多患者:
set.seed(101)
stack_data <- survsim::crisk.sim(n = 2000,
foltime = 200,
dist.ev = rep("weibull", 2),
anc.ev = c(0.8, 0.9),
beta0.ev = c(2, 4),
anc.cens = 1,
beta0.cens = 5,
nsit = 2)
m1 <- survreg(Surv(time, cause==1) ~ 1, data =stack_data, dist = "weibull")
m2 <- survreg(Surv(time, cause==2) ~ 1, data = stack_data, dist = "weibull")
m1$coefficients
这将接近 beta0.ev 原因 1
m2$coefficients
这将接近 beta0.ev 原因 2
> m1$coefficients
(Intercept)
1.976449
> m2$coefficients
(Intercept)
3.995716
m1$scale
这将接近 anc.ev 原因 1
m2$scale
这将接近 anc.ev 原因 2
> m1$scale
[1] 0.8088574
> m2$scale
[1] 0.8923334
不幸的是,这仅适用于统一审查或低非统一审查(例如在您的示例中)
如果我们增加审查的风险,则截距不代表 beta0.ev 参数
set.seed(101)
stack_data <- survsim::crisk.sim(n = 2000,
foltime = 200,
dist.ev = rep("weibull", 2),
anc.ev = c(0.8, 0.9),
beta0.ev = c(2, 4),
anc.cens = 1,
beta0.cens = 2, #reduced from 5, increasing the hazard function for censoring rate
nsit = 2)
m1 <- survreg(Surv(time, cause==1) ~ 1, data =stack_data, dist = "weibull")
m2 <- survreg(Surv(time, cause==2) ~ 1, data = stack_data, dist = "weibull")
> m1$coefficients
(Intercept)
1.531818
> m2$coefficients
(Intercept)
3.553687
>
> m1$scale
[1] 0.8139497
> m2$scale
[1] 0.8910465