哪种深度学习模型用于捕获图像中的次要特征？

Which deep learning model to use for capturing minor features in a image?

我有 class，它的功能与另一个 class 略有不同： ex - 此图像中有带扣（将其视为 class）https://6c819239693cc4960b69-cc9b957bf963b53239339d3141093094.ssl.cf3.rackcdn.com/1000006329245-822018-Black-Black-1000006329245-822018_01-345.jpg

但是这张图片和它很像但是没有扣: https://sc01.alicdn.com/kf/HTB1ASpYSVXXXXbdXpXXq6xXFXXXR/latest-modern-classic-chappal-slippers-for-men.jpg

我不太清楚在这种实际学习像素到像素值的情况下使用哪种模型。

任何想法都将不胜感激。谢谢！！

我已经尝试过 Inception、Resnet 等模型。

使用较少量的训练数据（每个 class 大约 300-400 个）我们能否达到良好的 recall/precision/F1 分数。

由于数据集较小，你可能想研究迁移学习，你可以做的是使用迁移的 ResNet 模型作为特征提取器，并在其上尝试 YOLO(You only look once) 算法，看通过每个window（Look Sliding window implementation using ConvNets）获得一个皮带扣，并基于它可以对图像进行分类。

根据我对您的数据集的了解，要执行上述方法，您需要根据 YOLO 算法的要求重新注释您的数据集。

要查看上述方法的示例，请访问 https://mc.ai/implementing-yolo-using-resnet-as-feature-extractor/

编辑如果您有 XML 注释数据集并需要将其转换为 csv 以遵循上述示例，请使用 https://github.com/datitran/raccoon_dataset

建模愉快。

哪种深度学习模型用于捕获图像中的次要特征？

Which deep learning model to use for capturing minor features in a image?

machine-learning

computer-vision

deep-learning

transfer-learning