mlr3：从 surv.gbm 获得响应（预测生存时间）

Question

mlr3 框架中的

surv.gbm 输出线性预测变量，但我真正感兴趣的是每个案例的预测生存时间，我想将其与实际生存时间进行比较。有没有办法得到实际的生存时间？

在 mlr3 书中，有一个线性预测变量和分布之间的转换示例。

pod = po("distrcompose", param_vals = list(form = "ph", overwrite = FALSE))
prediction = pod$predict(list(base = prediction_distr, pred = prediction_lp))$output

有没有办法更改此管道，以便将“lp”转换为“response”？

如有任何帮助，我们将不胜感激。

Answer 1

是的，这绝对有可能，只是需要再进行一次转换。您的第一步是根据线性预测器组成分布是正确的；因为您使用的是 surv.gbm 只有 Cox PH 可以作为基础模型，所以 distrcompose 的默认值适用于此。

现在您需要使用 crankcompose 来根据分布创建生存时间预测，您可以使用分布的均值、中值或众数，人们通常会选择均值或中值，但这是您的选择选择！只需确保包含 response = TRUE, overwrite = FALSE。下面的示例代码包括使用 RMSE 创建预测和评分（出乎意料的好！）。我认为这本书可能需要更新...

谢谢，拉斐尔

library(mlr3extralearners)
library(mlr3proba)
library(mlr3pipelines)
library(mlr3)

learn =  ppl("crankcompositor", ppl("distrcompositor", lrn("surv.gbm")),
             response = TRUE, overwrite = FALSE, method = "mean",
             graph_learner = TRUE)
set.seed(1)
task = tgen("simsurv")$generate(50)
learn$train(task)
p = learn$predict(task)
p$score(msr("surv.rmse"))

mlr3：从 surv.gbm 获得响应（预测生存时间）

mlr3: obtaining response (predicted survival time) from surv.gbm

r

survival-analysis

gbm

mlr3