R中的决策树-从特定分支提取数据

decision tree in R- extract data from a specific branch

我正在尝试使用 rpart 和 partykit 构建一个分类决策树,我想知道这些包(或任何包,就此而言)中是否有任何函数允许我创建一个包含来自具体的子树或分支?

我知道我可以使用 DT 规则从原始数据集中手动创建子集,但我正在尝试使某些过程自动化,发现该功能对我有很大帮助。

示例:

library (rpart)
library(partykit)

data("Titanic", package = "datasets")
ttnc <- as.data.frame(Titanic)
ttnc <- ttnc[rep(1:nrow(ttnc), ttnc$Freq), 1:4]
names(ttnc)[2] <- "Gender"

rp <- rpart(Survived ~ Gender + Age + Class,  data = ttnc)
prp <- as.party(rp)

prp[5]

假设我想从子树 #5 中提取数据,这些包中是否有任何函数允许我这样做?

谢谢!

我不知道你是不是使用DT规则来表达这个意思,但是你可以使用partykit包的predict()函数来预测节点/分支然后根据你的子树拆分数据.

ttnc$Node <- predict(prp, newdata = ttnc, type = "node")

subtree <- subset(ttnc, Node == 5)

除了@JakobGepp 发布的解决方案之外,您还可以使用 partykit 提供的 data_party() 函数:

data_party(prp, id = 5)

从本质上讲,这在内部与 Jakob 手动明确执行的操作相同。