如何处理我的数据集中不相关的图像

How to deal with irrelevant images in my dataset

我是深度学习的新手（目前通过 pyimagesearch 书籍学习），我有一个带注释的数据集（xml 个文件）。

我的问题如下：我没有与 xml 个文件相同数量的图像。我仔细观察并假设相关图像（缺少 xml 文件）与训练无关。

例如：我应该在墙上发现裂缝和锈迹（我的数据集中有），一些图片显示蓝天下的桥。

所以我的问题是如何处理这些图片？我应该生成缺失的 xml 文件并用 "empty" 边界框填充它们吗？如果是，我应该输入什么坐标？我想数据集做得很好，不需要生成更多 xml 文件，但在那种情况下，我不知道如何处理包含不相关图像的数据集。

据我所知，pyimagesearch书中的例子没有使用不相关图片的数据集。

感谢您的帮助并为我的英语道歉，它不是我的母语

您可以先删除不相关的图像，然后使用现有的 .xml 文件和相应的图像训练模型。

不需要在没有目标的图像上放置边界框类并将其提供给模型。

如果您还有其他问题，请发表评论。