为什么当少于 50% 的经历事件时生存曲线总和为 100%?

Why does Survival curve sum up to 100% when less than 50% experience event?

这个问题让我困惑的时间比我承认的要多。我已经隔离了问题,所以我可以复制它。

library(survival)
library(survminer)

set.seed(123)
test <- data.frame(rnorm(10000)+5,
                   sample(0:1, 10000, replace = TRUE))

colnames(test)<- c("time", "event")
#sum(test$event) = 4975
survfitted <- survfit(Surv(time = time, event = event) ~ 1,
                      data = test)
plot(survfitted, fun = "event")

为什么只有 49.75% 的人经历过事件,但这条曲线的总和为 100%?生成显示累积发生率比例的图的正确语法是什么?

问题似乎是审查被视为一个事件。

如果删失事件都发生在最后一个事件之前,那么最后一个事件将使 KM 曲线变为 0,或者如本例所示,将风险曲线变为 1.0。 (该图是危害而非生存的 KM 估计。)

您的模拟非常均匀地分布事件和审查,因此几乎任何此类图都会显示风险函数非常接近 1。如果您选择种子作为 9 ,您会得到一个它不会完全达到零的图.

set.seed(9)
png(); plot(survfitted, fun = "event"); abline(h=1);dev.off()

如果事件和删失时间在同一范围内均匀分布,则风险图将始终接近 1。大多数生存或危险图的医学示例在 hte 0-1 范围的中间终止的原因是通常在最后观察到的事件之后有许多审查超时。