Faster-RCNN bbox/image 归一化
Faster-RCNN bbox/image normalization
我正在自定义数据集上使用 py-faster-rcnn(大约 3000 张图像,7 种不同 类,包括背景),并遵循这些教程:
https://github.com/zeyuanxy/fast-rcnn/blob/master/help/train/README.md(Fast-RCNN教程)
https://github.com/deboc/py-faster-rcnn/tree/master/help(Faster-RCNN教程)
我正在使用 VGG16 网络的端到端解决方案。
一切正常,期待我的结果,所以我有一些问题:
- 图像和 bbox 注释需要什么样的规范化?
- 类似于上一个问题:有两个配置选项:BBOX_NORMALIZE_TARGETS和BBOX_NORMALIZE_TARGETS_PRECOMPUTED。我应该在训练前计算均值和标准差并将这些选项用于 bbox 归一化吗?
- 我在cls_score和bbox_pred层修改了num_output(根据这个线程:https://github.com/rbgirshick/py-faster-rcnn/issues/1),但是在end2end解决方案中有rpn_cls_score 和 rpn_bbox_pred 层也是。我也应该修改这些的 num_output 吗?如果我应该那么我如何计算 7 类 的输出数量?
不,您不需要预先计算任何东西。在 lib/roi_data_layer/roidb.py 中,如果将 BBOX_NORMALIZE_TARGETS_PRECOMPUTED 设置为 False,它会计算数据集的均值和标准差,否则,它将使用在 lib/fast_rcnn/config.py 中指定的默认值. RPN 与 类 的数量无关。它只将包含任何对象的区域视为正面,将其他所有内容视为负面。
我正在自定义数据集上使用 py-faster-rcnn(大约 3000 张图像,7 种不同 类,包括背景),并遵循这些教程:
https://github.com/zeyuanxy/fast-rcnn/blob/master/help/train/README.md(Fast-RCNN教程) https://github.com/deboc/py-faster-rcnn/tree/master/help(Faster-RCNN教程)
我正在使用 VGG16 网络的端到端解决方案。 一切正常,期待我的结果,所以我有一些问题:
- 图像和 bbox 注释需要什么样的规范化?
- 类似于上一个问题:有两个配置选项:BBOX_NORMALIZE_TARGETS和BBOX_NORMALIZE_TARGETS_PRECOMPUTED。我应该在训练前计算均值和标准差并将这些选项用于 bbox 归一化吗?
- 我在cls_score和bbox_pred层修改了num_output(根据这个线程:https://github.com/rbgirshick/py-faster-rcnn/issues/1),但是在end2end解决方案中有rpn_cls_score 和 rpn_bbox_pred 层也是。我也应该修改这些的 num_output 吗?如果我应该那么我如何计算 7 类 的输出数量?
不,您不需要预先计算任何东西。在 lib/roi_data_layer/roidb.py 中,如果将 BBOX_NORMALIZE_TARGETS_PRECOMPUTED 设置为 False,它会计算数据集的均值和标准差,否则,它将使用在 lib/fast_rcnn/config.py 中指定的默认值. RPN 与 类 的数量无关。它只将包含任何对象的区域视为正面,将其他所有内容视为负面。