是否可以使用多边形数据注释来执行张量流对象检测？

Question

我的问题不完全是使用多边形、圆或线注释数据，而是如何使用这些注释数据生成“.tfrecord”文件并执行对象检测。我看到的教程使用矩形注释，如下所示：taylor swift detection raccon detection

如果我要检测的对象（管道）不是太近，这对我来说会很棒。

以 PASCAL VOC 格式绘制的矩形示例：

<bndbox>
    <xmin>82</xmin>
    <xmax>172</xmax>
    <ymin>108</ymin>
    <ymax>146</ymax>
</bndbox>

有没有办法添加 "mask" 来突出显示此边界框的某些部分？

如果有什么不清楚的地方，请告诉我。

Answer 1

如果你的对象彼此非常接近，你可以进行实例分割而不是对象检测，在那里你可以使用多边形生成掩码和边界框来训练模型。

考虑一下这个呈现良好且易于使用的 mask-rcnn 存储库（一种实例分割）

检查 this 轻量级 mask-rcnn

Is it possible to use polygon data annotation to perform tensorflow object detection?