模型训练方法的比较

A comparison between model training approaches

假设我有一个数据集,由于 Kaggle 笔记本环境的限制,我决定将一个大数据集拆分成 "blocks"; A、B 和 C。此外,我想训练模型 10 个 epoch。如果我按如下方式训练模型,会有什么不同吗:

A ---> 10 个时期

B ---> 10 个时期

C ---> 10 个时期

与这种方法相比:

A ---> B ---> C [Epoch 1] ---> A ---> B ---> C [Epoch 2] ---> … ---> A - --> B ---> C [纪元 10]

此外,如果存在我认为存在但不确定的差异,一种方法是否比另一种更好?

对于机器学习,基本上您必须将所有训练数据放在一起,这样您的模型就不会遗漏数据集包含的任何模式。我想说的是,在训练模型之前还有一大步,即 Shuffle。想象一下,你一直被要求做纯数学,突然你的老师把你放在一个地理问题面前让你解决它,你会不知何故不知所措,机器也是一样!所以一定要用所有的数据来训练你的模型,如果你的A--->B--->C[Epoch 1]是一个shuffle的数据,那就太好了,不然你就得shuffle了。