测试集和训练集有什么区别?
Whats the difference between a test set and a train set?
测试集和训练集有什么区别?
区别很简单。
一般来说,您可以将训练集划分为 70% 的数据,将测试集划分为 30%。 (80/20也是可以的)
训练集是您用来训练模型(分类、回归)的数据集。设置一些通用规则后,将这些规则应用于 test 集,并检查有多少测试数据 predicted 正确。希望对您有所帮助!
您可能需要通过了解三个不同的概念来理解这个概念,它们是
a. training set
b. validation set
c. test set
您拥有的任何数据集以及当您想对其应用任何算法时,您需要将数据集拆分为以上三个。
一个。训练集通常你给出大约 60% 的原始数据-set.This 包含一组具有预分类目标和预测变量的数据 variables.That 是为了适应参数。
b。验证集通常需要大约 20% 来验证到目前为止从模型中学习到的知识。在统计学中,它被称为交叉 validation.Results,这里与未使用的预分类 data.The 验证数据集进行比较,提供对模型适合训练数据集的无偏评估。
c。测试集通常在 20% 左右,我们将我们选择的预测算法应用到我们的测试集上,以查看它的性能,这样我们就可以了解我们的算法 performance.It 不适合使用相同的数据进行训练以及测试,因为它不会让我们知道网络泛化的程度以及是否发生过拟合。因此我们需要保持分开的对。
拆分也可以是60-20-20甚至70-15-15
测试集和训练集有什么区别?
区别很简单。
一般来说,您可以将训练集划分为 70% 的数据,将测试集划分为 30%。 (80/20也是可以的)
训练集是您用来训练模型(分类、回归)的数据集。设置一些通用规则后,将这些规则应用于 test 集,并检查有多少测试数据 predicted 正确。希望对您有所帮助!
您可能需要通过了解三个不同的概念来理解这个概念,它们是
a. training set
b. validation set
c. test set
您拥有的任何数据集以及当您想对其应用任何算法时,您需要将数据集拆分为以上三个。
一个。训练集通常你给出大约 60% 的原始数据-set.This 包含一组具有预分类目标和预测变量的数据 variables.That 是为了适应参数。
b。验证集通常需要大约 20% 来验证到目前为止从模型中学习到的知识。在统计学中,它被称为交叉 validation.Results,这里与未使用的预分类 data.The 验证数据集进行比较,提供对模型适合训练数据集的无偏评估。
c。测试集通常在 20% 左右,我们将我们选择的预测算法应用到我们的测试集上,以查看它的性能,这样我们就可以了解我们的算法 performance.It 不适合使用相同的数据进行训练以及测试,因为它不会让我们知道网络泛化的程度以及是否发生过拟合。因此我们需要保持分开的对。
拆分也可以是60-20-20甚至70-15-15