如何处理我的数据集中不相关的图像

How to deal with irrelevant images in my dataset

我是深度学习的新手(目前通过 pyimagesearch 书籍学习),我有一个带注释的数据集(xml 个文件)。

我的问题如下:我没有与 xml 个文件相同数量的图像。 我仔细观察并假设相关图像(缺少 xml 文件)与训练无关。

例如:我应该在墙上发现裂缝和锈迹(我的数据集中有),一些图片显示蓝天下的桥。

所以我的问题是如何处理这些图片? 我应该生成缺失的 xml 文件并用 "empty" 边界框填充它们吗? 如果是,我应该输入什么坐标? 我想数据集做得很好,不需要生成更多 xml 文件,但在那种情况下,我不知道如何处理包含不相关图像的数据集。

据我所知,pyimagesearch书中的例子没有使用不相关图片的数据集。

感谢您的帮助并为我的英语道歉,它不是我的母语

您可以先删除不相关的图像,然后使用现有的 .xml 文件和相应的图像训练模型。

不需要在没有目标的图像上放置边界框 类 并将其提供给模型。

如果您还有其他问题,请发表评论。