是否可以使用多边形数据注释来执行张量流对象检测?

Is it possible to use polygon data annotation to perform tensorflow object detection?

我的问题不完全是使用多边形、圆或线注释数据,而是如何使用这些注释数据生成“.tfrecord”文件并执行对象检测。我看到的教程使用矩形注释,如下所示:taylor swift detection raccon detection

如果我要检测的对象(管道)不是太近,这对我来说会很棒。

以 PASCAL VOC 格式绘制的矩形示例:

<bndbox>
    <xmin>82</xmin>
    <xmax>172</xmax>
    <ymin>108</ymin>
    <ymax>146</ymax>
</bndbox>

有没有办法添加 "mask" 来突出显示此边界框的某些部分?

如果有什么不清楚的地方,请告诉我。

如果你的对象彼此非常接近,你可以进行实例分割而不是对象检测,在那里你可以使用多边形生成掩码和边界框来训练模型。

考虑一下这个呈现良好且易于使用的 mask-rcnn 存储库(一种实例分割)

https://github.com/matterport/Mask_RCNN

检查 this 轻量级 mask-rcnn