用多边形标记图像比正方形更好吗?

Is labelling images with polygon better than square?

我的目标是做一个物体检测模型,我用方框标记了数据 如果我用多边形标记图像,它会比正方形好吗?

(在图片上标注是否戴安全帽)

我确实尝试在一些图像上使用多边形标记,并在为 YOLO 导出 txt 文件后 为什么它在文本文件中只有 4 个点与标记为正方形的相同 这些点如何代表我准确标记的区域?

1 0.573748 0.018953 0.045332 0.036101
1 0.944520 0.098375 0.108931 0.167870

您以多边形格式标记了您的对象,但是当您转换为 YOLO 格式时,标记中的信息减少了。下图显示了我想是怎么发生的;

...您在其中完成了多边形形状注释(黑色形状)。但是,转换已经从多边形坐标点“搜索”了最小的 x 值,并从相应的多边形坐标点“搜索”了最小的 y 值。而且,这些是 YOLO 格式的“前两个”值。 “宽度”和“高度”参数也发生了同样的逻辑。

https://www.youtube.com/watch?v=h6s61a_pqfM 中对标签和数据集背后的想法进行了很好的描述。

简而言之;为了您的目的(为了效率),我建议您仅使用矩形进行快速方便的注释 - 无需耗时的多边形注释。

您使用的 YOLO 很可能只支持方形标注。 请参阅 this video 显示正方形与多边形质量的检测结果,以及创建自定义数据集所需的注释时间问题。

要使用多边形蒙版,我建议改用 YOLOv3-Polygon or YOLOv5-Polygon