拆分R中的数据,拆分成百分比
Split the data in R, split into percentage
我有一个数据集对应不同类型的数据集。那么如何计算大小写。
数据应分为一个案例:1) 第一个案例 - 15% 的训练数据和 5% 的测试
如何正确书写?
没有createDataPartition,一个简单的方法如下。
假设您希望 train_prop
作为训练集,test_prop
作为数据集 my_dataset
的测试集。理想情况下,它们的总和将是 1
,或 1-val_prop
,但出于某种原因,这里您需要 15% 和 5%。所以你分别需要 0.15 和 0.05。
indices <- sample(x = rep.int(x = c(0, 1, 2),
times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]
我有一个数据集对应不同类型的数据集。那么如何计算大小写。
数据应分为一个案例:1) 第一个案例 - 15% 的训练数据和 5% 的测试
如何正确书写?
没有createDataPartition,一个简单的方法如下。
假设您希望 train_prop
作为训练集,test_prop
作为数据集 my_dataset
的测试集。理想情况下,它们的总和将是 1
,或 1-val_prop
,但出于某种原因,这里您需要 15% 和 5%。所以你分别需要 0.15 和 0.05。
indices <- sample(x = rep.int(x = c(0, 1, 2),
times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]