哪种深度学习模型用于捕获图像中的次要特征?

Which deep learning model to use for capturing minor features in a image?

我有 class,它的功能与另一个 class 略有不同: ex - 此图像中有带扣(将其视为 class)https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

但是这张图片和它很像但是没有扣: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

我不太清楚在这种实际学习像素到像素值的情况下使用哪种模型。

任何想法都将不胜感激。 谢谢!!

我已经尝试过 Inception、Resnet 等模型。

使用较少量的训练数据(每个 class 大约 300-400 个)我们能否达到良好的 recall/precision/F1 分数。

由于数据集较小,你可能想研究迁移学习,你可以做的是使用迁移的 ResNet 模型作为特征提取器,并在其上尝试 YOLO(You only look once) 算法,看通过每个window(Look Sliding window implementation using ConvNets)获得一个皮带扣,并基于它可以对图像进行分类。

根据我对您的数据集的了解,要执行上述方法,您需要根据 YOLO 算法的要求重新注释您的数据集。

要查看上述方法的示例,请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

编辑 如果您有 XML 注释数据集并需要将其转换为 csv 以遵循上述示例,请使用 https://github.com/datitran/raccoon_dataset

建模愉快。