我们可以将使用 SparkR 构建的随机森林模型导入到 R,然后使用 getTree 提取其中一棵树吗?

Can we import the random forest model built using SparkR to R and then use getTree to extract one of the trees?

就像在决策树中我们可以看到或可视化节点分裂一样,我想做类似的事情。但我使用的是 SparkR,它没有决策树。所以我打算在 SparkR 上使用带有 1 棵树作为参数和 运行 的随机森林,然后保存模型并使用 getTree 查看节点拆分并使用 ggplot 进一步可视化。

简短的回答是

使用 SparkR 构建的模型与使用相应 R 包构建的模型不兼容,在这种情况下 randomForest;因此,您将无法使用后者的 getTree 函数来可视化使用 SparkR 构建的随机森林中的树。

在不同的层面上:我很惊讶决策树仍然没有进入 SparkR - 它们似乎已经准备好几个月了 Github repo;但即使是这样,也不希望它们提供可视化树的方法,并且您仍然无法为此目的使用其他 R 包中的函数。