为什么我们需要 test_generator 和 val_generator 进行数据扩充

Why do we need test_generator and val_generator for data augmentation

数据扩充仅用于训练。我想知道为什么几个教程创建 test_generator 和 val_generator。为什么我们不只创建 train_generator.

实际上,将训练数据和验证数据分开是一个很好的做法。如果您只创建 1 个生成器,您很有可能会使用相同的增强数据来验证您的模型,这会给您的准确性带来偏差。此外,通常我们在只有少量训练数据时使用数据增强,这会使事情变得更糟并最终得到高度偏差的模型。因此,我们应该分离数据并确保您的模型没有暴露于任何类型的验证数据,这样它就不会给您的性能增加任何偏差。

例如,您可能会以顺时针旋转图片 1 来训练模型,并以逆时针旋转图片 1 来验证模型。因此,我们通常用于确定过度拟合的验证准确性是有偏差的,您最终可能会得到过度拟合的模型,而不知道它在训练期间何时发生。