如何找到生存分析的最佳分类?

How do I find the best categorization for survival analysis?

我有一个关于生存分析的问题。但是,我有以下数据(只是摘录):

现在我正在尝试使用 Python 生命线包进行生存分析。例如,我想了解 T 细胞是否会影响总体存活率 (OS)。但据我所知,我需要对不同类别的 T 细胞数量进行分类,例如高 T 细胞和低 T 细胞……对吗?但是我如何找到最合适的 Cut-Out? 我的计划是表明,具有高 T 细胞的肿瘤比低 T 细胞具有更好的存活率。但是我怎样才能从我这里的数据中找到区分高 T 细胞和低 T 细胞的最佳截止值。

有人有想法吗?我的一个朋友说了一些关于“ROC”的分析,但我现在真的很困惑......如果有任何帮助,我会很高兴!

连续变量到分类变量的转换远非显而易见。第一种方法可以基于 现有文献 ,尤其是 medicine/biology。对现有文献的回顾可能足以创建这些 类。另一种方法可以基于 T 细胞变量的经验分布,有时会突出“明显”的分类。使用 ROC 曲线可能是个好主意,但不知何故我认为没有必要。在 Kaplan-Meier 类型的生存分析中对您的变量进行分类是必要的,但如果您使用 Cox 模型,则无需对该变量进行分类。所以我建议你转向 Cox 回归来进行你的生存分析。 Cox 回归允许您在建模中添加多个预测变量以及交互项,这样更方便。