测试集和训练集有什么区别?

Whats the difference between a test set and a train set?

测试集和训练集有什么区别?

区别很简单。

一般来说,您可以将训练集划分为 70% 的数据,将测试集划分为 30%。 (80/20也是可以的)

训练集是您用来训练模型(分类、回归)的数据集。设置一些通用规则后,将这些规则应用于 test 集,并检查有多少测试数据 predicted 正确。希望对您有所帮助!

您可能需要通过了解三个不同的概念来理解这个概念,它们是

a. training set

b. validation set

c. test set

您拥有的任何数据集以及当您想对其应用任何算法时,您需要将数据集拆分为以上三个。

一个。训练集通常你给出大约 60% 的原始数据-set.This 包含一组具有预分类目标和预测变量的数据 variables.That 是为了适应参数。

b。验证集通常需要大约 20% 来验证到目前为止从模型中学习到的知识。在统计学中,它被称为交叉 validation.Results,这里与未使用的预分类 data.The 验证数据集进行比较,提供对模型适合训练数据集的无偏评估。

c。测试集通常在 20% 左右,我们将我们选择的预测算法应用到我们的测试集上,以查看它的性能,这样我们就可以了解我们的算法 performance.It 不适合使用相同的数据进行训练以及测试,因为它不会让我们知道网络泛化的程度以及是否发生过拟合。因此我们需要保持分开的对。

拆分也可以是60-20-20甚至70-15-15