R中的决策树-从特定分支提取数据
decision tree in R- extract data from a specific branch
我正在尝试使用 rpart 和 partykit 构建一个分类决策树,我想知道这些包(或任何包,就此而言)中是否有任何函数允许我创建一个包含来自具体的子树或分支?
我知道我可以使用 DT 规则从原始数据集中手动创建子集,但我正在尝试使某些过程自动化,发现该功能对我有很大帮助。
示例:
library (rpart)
library(partykit)
data("Titanic", package = "datasets")
ttnc <- as.data.frame(Titanic)
ttnc <- ttnc[rep(1:nrow(ttnc), ttnc$Freq), 1:4]
names(ttnc)[2] <- "Gender"
rp <- rpart(Survived ~ Gender + Age + Class, data = ttnc)
prp <- as.party(rp)
prp[5]
假设我想从子树 #5 中提取数据,这些包中是否有任何函数允许我这样做?
谢谢!
我不知道你是不是使用DT规则来表达这个意思,但是你可以使用partykit包的predict()
函数来预测节点/分支然后根据你的子树拆分数据.
ttnc$Node <- predict(prp, newdata = ttnc, type = "node")
subtree <- subset(ttnc, Node == 5)
除了@JakobGepp 发布的解决方案之外,您还可以使用 partykit
提供的 data_party()
函数:
data_party(prp, id = 5)
从本质上讲,这在内部与 Jakob 手动明确执行的操作相同。
我正在尝试使用 rpart 和 partykit 构建一个分类决策树,我想知道这些包(或任何包,就此而言)中是否有任何函数允许我创建一个包含来自具体的子树或分支?
我知道我可以使用 DT 规则从原始数据集中手动创建子集,但我正在尝试使某些过程自动化,发现该功能对我有很大帮助。
示例:
library (rpart)
library(partykit)
data("Titanic", package = "datasets")
ttnc <- as.data.frame(Titanic)
ttnc <- ttnc[rep(1:nrow(ttnc), ttnc$Freq), 1:4]
names(ttnc)[2] <- "Gender"
rp <- rpart(Survived ~ Gender + Age + Class, data = ttnc)
prp <- as.party(rp)
prp[5]
假设我想从子树 #5 中提取数据,这些包中是否有任何函数允许我这样做?
谢谢!
我不知道你是不是使用DT规则来表达这个意思,但是你可以使用partykit包的predict()
函数来预测节点/分支然后根据你的子树拆分数据.
ttnc$Node <- predict(prp, newdata = ttnc, type = "node")
subtree <- subset(ttnc, Node == 5)
除了@JakobGepp 发布的解决方案之外,您还可以使用 partykit
提供的 data_party()
函数:
data_party(prp, id = 5)
从本质上讲,这在内部与 Jakob 手动明确执行的操作相同。