远离相机检测的Tensorflow小物体
Tenorflow small objects far from camera detection
我正在使用 tensorflow 对象检测 API 进行对象检测任务。但是,我有一些物体是从高角度(相机在 10 m 处)拍摄的,并且尺寸非常小,图像尺寸为 1920 x 1080。
问题:
1) 在这种情况下检测小物体的最佳方法是什么?
2) 合适的数据集有哪些特点?来自相同视图的图像(也许!)?
非常感谢您的所有回答,谢谢 :)
即使使用 1920x1080 等高分辨率图像,也必须考虑对象检测器的输入大小。
因为对象检测器将输入图像的大小调整为其架构大小(例如,一般 YOLO 在其架构中使用 410x410 输入)
另一方面,如果您按原样使用 1920x1080 图片,您的 API 会将其调整为较小的分辨率,例如 410x410。
这意味着图像中的小物体在通过卷积滤镜时会消失。
在我看来,
1) 如果您知道小物体在整个图像中的位置,裁剪并分离图像并将其用作输入图像。
即使你不知道小物体在哪里,你也可以制作几个候选列表,用某种方法分隔开。
2) 不明白你想知道什么,请说得具体点。
我认为你应该尝试使用 kitti 数据集的 "faster_rcnn_resnet101" 模型,它的最大图像大小为 1987。但与任何其他 SSD 模型相比,该模型非常慢。配置 link 如下 -
此外,Faster rcnn 模型在小物体检测方面比 yolo 做得更好,不确定 ssd 模型的性能。
我正在使用 tensorflow 对象检测 API 进行对象检测任务。但是,我有一些物体是从高角度(相机在 10 m 处)拍摄的,并且尺寸非常小,图像尺寸为 1920 x 1080。
问题:
1) 在这种情况下检测小物体的最佳方法是什么?
2) 合适的数据集有哪些特点?来自相同视图的图像(也许!)?
非常感谢您的所有回答,谢谢 :)
即使使用 1920x1080 等高分辨率图像,也必须考虑对象检测器的输入大小。
因为对象检测器将输入图像的大小调整为其架构大小(例如,一般 YOLO 在其架构中使用 410x410 输入)
另一方面,如果您按原样使用 1920x1080 图片,您的 API 会将其调整为较小的分辨率,例如 410x410。
这意味着图像中的小物体在通过卷积滤镜时会消失。
在我看来,
1) 如果您知道小物体在整个图像中的位置,裁剪并分离图像并将其用作输入图像。
即使你不知道小物体在哪里,你也可以制作几个候选列表,用某种方法分隔开。
2) 不明白你想知道什么,请说得具体点。
我认为你应该尝试使用 kitti 数据集的 "faster_rcnn_resnet101" 模型,它的最大图像大小为 1987。但与任何其他 SSD 模型相比,该模型非常慢。配置 link 如下 -
此外,Faster rcnn 模型在小物体检测方面比 yolo 做得更好,不确定 ssd 模型的性能。