TensorFlow 对象检测可视化、对象分组

TensorFlow Object Detection visualation, grouping objects

当对包含人群的图像使用 TensorFlow 对象检测时,对象会像这样组合在一起:

Imgur link

这对于某些用例来说当然很好,但我想知道是否有办法不将对象组合在一起。

当对象组合在一起时,有没有办法降低阈值?

我认为这是因为有时在 COCO 训练集中,人群被注释为 "person"。因此,检测器还学习将人群标记为 "person"。有一种方法可以忽略这些 "is_crowd" 个人注释,但我们还没有这样做。