拟合分类树并使用测试集

Question

library(tree)
library(ISLR)
data("Carseats")
High<-ifelse(Carseats$Sales<=8,'No','Yes')
Carseats<-data.frame(Carseats,High)
tree.Carseats<-tree(as.factor(High)~.-Sales, data = Carseats)
summary(tree.Carseats)
plot(tree.Carseats)
text(tree.Carseats,pretty=0)
set.seed(1)
train=sample(1:nrow(Carseats),200)

我写信是想询问代码 train=sample(1:nrow(Carseats),200)。

此代码的结果只是显示数据，我无法使用 View(train) 查看数据集。

IMO，我认为对于 sample，我们将选择数据集的行 data(Carseats)，每个元素应包含一些标签，例如销售额、收入...

可能是我对后面的理论思路比较迷惑

Answer 1

train=... 行代码只是创建一个包含 200 个随机数（介于 1 和 nrow(Carseats) 之间）的整数向量。您实际上需要对数据进行子集化。像这样：

train_index <- sample(nrow(Carseats), 200)
training_data <- Carseats[train_index, ]

那么您将希望您的测试数据具有剩余的观察值，例如，

test_data <- Carseats[-train_index, ]

拟合分类树并使用测试集

Fitting classification trees and use the test set

tree

r

sample

classification