拟合分类树并使用测试集

Fitting classification trees and use the test set

library(tree)
library(ISLR)
data("Carseats")
High<-ifelse(Carseats$Sales<=8,'No','Yes')
Carseats<-data.frame(Carseats,High)
tree.Carseats<-tree(as.factor(High)~.-Sales, data = Carseats)
summary(tree.Carseats)
plot(tree.Carseats)
text(tree.Carseats,pretty=0)
set.seed(1)
train=sample(1:nrow(Carseats),200)

我写信是想询问代码 train=sample(1:nrow(Carseats),200)

此代码的结果只是显示数据,我无法使用 View(train) 查看数据集。

IMO,我认为对于 sample,我们将选择数据集的行 data(Carseats),每个元素应包含一些标签,例如销售额、收入...

可能是我对后面的理论思路比较迷惑

train=... 行代码只是创建一个包含 200 个随机数(介于 1 和 nrow(Carseats) 之间)的整数向量。您实际上需要对数据进行子集化。像这样:

train_index <- sample(nrow(Carseats), 200)
training_data <- Carseats[train_index, ]

那么您将希望您的测试数据具有剩余的观察值,例如,

test_data <- Carseats[-train_index, ]