测试集和训练集有什么区别？

Whats the difference between a test set and a train set?

测试集和训练集有什么区别？

区别很简单。

一般来说，您可以将训练集划分为 70% 的数据，将测试集划分为 30%。（80/20也是可以的）

训练集是您用来训练模型（分类、回归）的数据集。设置一些通用规则后，将这些规则应用于 test 集，并检查有多少测试数据 predicted 正确。希望对您有所帮助！

您可能需要通过了解三个不同的概念来理解这个概念，它们是

a. training set

b. validation set

c. test set

您拥有的任何数据集以及当您想对其应用任何算法时，您需要将数据集拆分为以上三个。

一个。训练集通常你给出大约 60% 的原始数据-set.This 包含一组具有预分类目标和预测变量的数据 variables.That 是为了适应参数。

b。验证集通常需要大约 20% 来验证到目前为止从模型中学习到的知识。在统计学中，它被称为交叉 validation.Results，这里与未使用的预分类 data.The 验证数据集进行比较，提供对模型适合训练数据集的无偏评估。

c。测试集通常在 20% 左右，我们将我们选择的预测算法应用到我们的测试集上，以查看它的性能，这样我们就可以了解我们的算法 performance.It 不适合使用相同的数据进行训练以及测试，因为它不会让我们知道网络泛化的程度以及是否发生过拟合。因此我们需要保持分开的对。

拆分也可以是60-20-20甚至70-15-15