MXnet - 支持 ROI-Pooling 的 CNN 的 ImageRecordIter 和数据增强

MXnet - ImageRecordIter and data augmentation for ROI-Pooling enabled CNN

在使用 MXnet 开发的 CNN 网络中使用 ROI-Pooling 时如何进行数据增强?

例如,假设我有一个使用 roi-pooling 层的 resnet50 架构,我想在 ImageRecord 迭代器中使用随机裁剪数据增强。

是否有一种自动方式将 rois 中的数据坐标传递到 roi 池化层,进行转换以应用于由 ImageRecord Iterator 的数据增强过程生成的图像?

您应该能够为此重新调整 ImageDetRecordIter 的用途。它旨在与包含边界框的对象检测数据一起使用,但您可以将边界框定义为 ROI。现在,当您应用增强操作(例如翻转和旋转)时,边界框的坐标将根据图像进行调整。

否则,您可以使用 Gluon 轻松编写您自己的 transform 函数,并且可以利用任何 OpenCV 增强来应用于您的图像和 ROI。只需编写一个获取数据和标签的函数,以及 returns 增强数据和标签。