图像数据增强

Image data augmentation

我正在做一个计算机视觉项目,我需要应用数据增强。 我有 3 个 classes:两个 classes 有 500 张图片,一个 class 有 1000 张图片。 我将生成带有数据增强的图像的多个版本,我是否应该在前两个 class 上应用例如 3 个随机变换,总共有 2000 张图像,并在最后的 class 上只应用一个变换] 总共有 2000 个 classes? 最后,应该将数据扩充应用于整个数据集,然后将其分成训练和测试,或者将其分开,然后将扩充应用于训练数据集。 谢谢

数据增强仅应用于训练集。不要碰测试集。

在训练中随机应用增强。因此,特定图像在特定时期可能会或可能不会被增强。

无需单独处理 classes 来处理 class-不平衡。 Class 使用适当的损失函数处理不平衡,例如 cross-entropy or focal loss function in retinanet