拟合分类树并使用测试集
Fitting classification trees and use the test set
library(tree)
library(ISLR)
data("Carseats")
High<-ifelse(Carseats$Sales<=8,'No','Yes')
Carseats<-data.frame(Carseats,High)
tree.Carseats<-tree(as.factor(High)~.-Sales, data = Carseats)
summary(tree.Carseats)
plot(tree.Carseats)
text(tree.Carseats,pretty=0)
set.seed(1)
train=sample(1:nrow(Carseats),200)
我写信是想询问代码 train=sample(1:nrow(Carseats),200)
。
此代码的结果只是显示数据,我无法使用 View(train)
查看数据集。
IMO,我认为对于 sample
,我们将选择数据集的行 data(Carseats)
,每个元素应包含一些标签,例如销售额、收入...
可能是我对后面的理论思路比较迷惑
train=...
行代码只是创建一个包含 200 个随机数(介于 1 和 nrow(Carseats)
之间)的整数向量。您实际上需要对数据进行子集化。像这样:
train_index <- sample(nrow(Carseats), 200)
training_data <- Carseats[train_index, ]
那么您将希望您的测试数据具有剩余的观察值,例如,
test_data <- Carseats[-train_index, ]
library(tree)
library(ISLR)
data("Carseats")
High<-ifelse(Carseats$Sales<=8,'No','Yes')
Carseats<-data.frame(Carseats,High)
tree.Carseats<-tree(as.factor(High)~.-Sales, data = Carseats)
summary(tree.Carseats)
plot(tree.Carseats)
text(tree.Carseats,pretty=0)
set.seed(1)
train=sample(1:nrow(Carseats),200)
我写信是想询问代码 train=sample(1:nrow(Carseats),200)
。
此代码的结果只是显示数据,我无法使用 View(train)
查看数据集。
IMO,我认为对于 sample
,我们将选择数据集的行 data(Carseats)
,每个元素应包含一些标签,例如销售额、收入...
可能是我对后面的理论思路比较迷惑
train=...
行代码只是创建一个包含 200 个随机数(介于 1 和 nrow(Carseats)
之间)的整数向量。您实际上需要对数据进行子集化。像这样:
train_index <- sample(nrow(Carseats), 200)
training_data <- Carseats[train_index, ]
那么您将希望您的测试数据具有剩余的观察值,例如,
test_data <- Carseats[-train_index, ]