如何使用决策树进行生存分析?

How to use decision trees for survival analysis?

我在理解和应用决策树进行生存分析时遇到问题 Python。我有一个数据集,其中包含变量年龄、体重、肿瘤大小、体积……(所有浮点数),我想知道是否与总体存活率(也是一个浮点数)相关。

但是我该如何应用决策树呢?在文献中,我只看到 y_train 必须是分类变量的示例(例如 0 或 1,良性或恶性,......)但它不适用于像浮点数这样的连续变量。

但是我想创建一个决策树,这样最后你可以发现肿瘤大小 > xx 和体积 >yy 你预测的总生存期约为 < zzz。

有人可以帮我解决我的问题吗?有谁知道在哪里可以阅读有关此主题的更多信息?

Scikit-survival 包提供了一些集成决策树模型,例如 RandomSurvivalForest and also classical models like the Cox model CoxPhSurvivalAnalysis

文档提供了很好的代码example。关于目标变量 y,至少在这种情况下,文档说明

y – A structured array containing the binary event indicator as first field, and time of event or time of censoring as second field.