TensorFlow 对象检测可视化、对象分组

TensorFlow Object Detection visualation, grouping objects

当对包含人群的图像使用 TensorFlow 对象检测时，对象会像这样组合在一起：

Imgur link

这对于某些用例来说当然很好，但我想知道是否有办法不将对象组合在一起。

当对象组合在一起时，有没有办法降低阈值？

我认为这是因为有时在 COCO 训练集中，人群被注释为 "person"。因此，检测器还学习将人群标记为 "person"。有一种方法可以忽略这些 "is_crowd" 个人注释，但我们还没有这样做。