使用 'rpart' 和 ~ 符号前的多个变量创建公式
Creating a formula using 'rpart' with multiple variables before the ~ symbol
我很确定我的问题没有完全意义,但我正在尝试使用 'rpart' 在 R 中创建一个分类树,最初的拟合如下:
fit <- rpart(success ~ A + B + C)
我现在意识到 'success' 也可以用另一个 'value' 来衡量。所以我打算将其修改为:
fit <- rpart(success + new_option ~ A + B + C)
但是当我 运行 这些行时:
plot(fit, uniform=TRUE, main="Success plot")
text(fit, use.n = TRUE, all=TRUE, cex=.8)
post(fit, file = "tree.ps", title="Success plot")
我收到这个错误:
Error in plot.rpart(fit, uniform = TRUE, main = "Success plot") :
fit is not a tree, just a root
所以只是想知道 - 这可能吗?还是我需要以完全不同的方式解决这个问题?
这意味着您的树算法没有创建任何分裂。您可以使用 cp 参数来增加树的复杂性。 cp 的默认值为 0.01,因此您可以尝试 0.001。但请注意,这可能意味着您过度拟合了您的模型。
p.s..你只能有响应变量而不是var1 + var 2 ...如果你需要结合两者,在你将它插入你的建模函数之前做。
对我来说,当我把它写成:
fit <- rpart(cbind(success, new_option) ~ A + B + C)
我很确定我的问题没有完全意义,但我正在尝试使用 'rpart' 在 R 中创建一个分类树,最初的拟合如下:
fit <- rpart(success ~ A + B + C)
我现在意识到 'success' 也可以用另一个 'value' 来衡量。所以我打算将其修改为:
fit <- rpart(success + new_option ~ A + B + C)
但是当我 运行 这些行时:
plot(fit, uniform=TRUE, main="Success plot")
text(fit, use.n = TRUE, all=TRUE, cex=.8)
post(fit, file = "tree.ps", title="Success plot")
我收到这个错误:
Error in plot.rpart(fit, uniform = TRUE, main = "Success plot") :
fit is not a tree, just a root
所以只是想知道 - 这可能吗?还是我需要以完全不同的方式解决这个问题?
这意味着您的树算法没有创建任何分裂。您可以使用 cp 参数来增加树的复杂性。 cp 的默认值为 0.01,因此您可以尝试 0.001。但请注意,这可能意味着您过度拟合了您的模型。
p.s..你只能有响应变量而不是var1 + var 2 ...如果你需要结合两者,在你将它插入你的建模函数之前做。
对我来说,当我把它写成:
fit <- rpart(cbind(success, new_option) ~ A + B + C)