我可以手动创建 RWeka 决策(递归分区)树吗?

Can I manually create an RWeka decision (Recursive Partitioning) tree?

我使用 RWeka 构建了一个 J48 决策树。我想将其性能与描述现有(外部计算)决策树的决策树进行比较。我是 RWeka 的新手,在手动创建 RWeka 决策树时遇到问题。理想情况下,我想并排显示这两个并使用 RWeka 可视化绘制它们(它非常有用且干净)。

现在,我要将 RWeka 计算的决策树导出到 Graphviz,并将其操作成我想要的结构。我想在开始之前检查并确保我不能简单地指定我想手动指定决策树的规则。

我不想计算决策树(我已经这样做了),我想手动 construct/specify 决策树(以便在我的演示文稿中进行统一比较)。

先谢谢你。

RWeka 包本身无法做到这一点。然而,RWeka 使用 partykit 包来显示它的树,它可以做你想做的事。查看 vignette(“partykit“, package = “partykit“) 如何使用预先指定的 partysplit 构造递归 partynode 对象,然后将它们转换为 constparty。小插图为此提供了一个实践示例。

这是 @Achim Zeileis 建议的软件包 partykit 的一些示例代码。

library(partykit)

加载数据:

data("WeatherPlay", package = "partykit")
WeatherPlay
#  outlook temperature humidity windy play
#  1 sunny 85 85 false no
#  2 sunny 80 90 true no
#  3 overcast 83 86 false yes
#  4 rainy 70 96 false yes
#  5 rainy 68 80 false yes
#  6 rainy 65 70 true no
#  7 overcast 64 65 true yes
...

初始化决定: integer 1L 表示应用此拆分的尚未指定的数据框的列。索引对应于一个因子的水平(离散分割),中断对应于一个截止点(连续分割)。

sp_o <- partysplit(1L, index = 1:3)
sp_h <- partysplit(3L, breaks = 75)
sp_w <- partysplit(4L, index = 1:2)

将决策合并到节点中:

pn <- partynode(1L, split = sp_o, kids = list(
  partynode(2L, split = sp_h, kids = list(
  partynode(3L, info = "yes"),
  partynode(4L, info = "no"))),
  partynode(5L, info = "yes"),
  partynode(6L, split = sp_w, kids = list(
  partynode(7L, info = "yes"),
  partynode(8L, info = "no")))))

将数据拟合到树:

t2 <- party(pn,
  data = WeatherPlay,
  fitted = data.frame(
    "(fitted)" = fitted_node(pn, data = WeatherPlay),
    "(response)" = WeatherPlay$play, # response variable
  check.names = FALSE),
  terms = terms(play ~ ., data = WeatherPlay),
  )

t3 <- as.constparty(t2)
plot(t3)

来源:http://cran.r-project.org/web/packages/partykit/vignettes/partykit.pdf