如何为 R 生存分析设置数据
How to set data for R survival analysis
如果这个问题看起来很愚蠢,我很抱歉,但我有一个小数据集,我想用 R 包 "survival" 的函数 "survfit" 来操作,而且,好吧,我不不知道如何设置 "survfit" 可用的适当数据框;数据如下:
time number_at_risk number_death number_censored
1 25 10 0 2
2 28 8 1 0
3 33 7 1 0
4 37 6 0 1
5 41 5 1 0
6 43 4 0 1
7 48 3 0 3
现在,如果我 运行 通常的语法 survfit(Surv(time, number_censored) ~ 1, data = data)
,它会给我警告 In Surv(time, number_censored) : Invalid status value, converted to NA
。
显然,数据组织不当。那么,我应该如何设置我的数据框?
谢谢
time
必须是包含事件发生时间的向量,status
是该事件是审查还是死亡 (0/1) 的指标。
在您的示例中,数据应如下所示:
times = c(1,1,2,3,4,5,6,7,7,7)
status = c(0,0,1,1,0,1,0,0,0,0)
survfit(Surv(times,status)~1)
如果这个问题看起来很愚蠢,我很抱歉,但我有一个小数据集,我想用 R 包 "survival" 的函数 "survfit" 来操作,而且,好吧,我不不知道如何设置 "survfit" 可用的适当数据框;数据如下:
time number_at_risk number_death number_censored
1 25 10 0 2
2 28 8 1 0
3 33 7 1 0
4 37 6 0 1
5 41 5 1 0
6 43 4 0 1
7 48 3 0 3
现在,如果我 运行 通常的语法 survfit(Surv(time, number_censored) ~ 1, data = data)
,它会给我警告 In Surv(time, number_censored) : Invalid status value, converted to NA
。
显然,数据组织不当。那么,我应该如何设置我的数据框? 谢谢
time
必须是包含事件发生时间的向量,status
是该事件是审查还是死亡 (0/1) 的指标。
在您的示例中,数据应如下所示:
times = c(1,1,2,3,4,5,6,7,7,7)
status = c(0,0,1,1,0,1,0,0,0,0)
survfit(Surv(times,status)~1)