Faster-RCNN bbox/image 归一化

Faster-RCNN bbox/image normalization

我正在自定义数据集上使用 py-faster-rcnn（大约 3000 张图像，7 种不同类，包括背景），并遵循这些教程：

https://github.com/zeyuanxy/fast-rcnn/blob/master/help/train/README.md（Fast-RCNN教程） https://github.com/deboc/py-faster-rcnn/tree/master/help（Faster-RCNN教程）

我正在使用 VGG16 网络的端到端解决方案。一切正常，期待我的结果，所以我有一些问题：

图像和 bbox 注释需要什么样的规范化？
类似于上一个问题：有两个配置选项：BBOX_NORMALIZE_TARGETS和BBOX_NORMALIZE_TARGETS_PRECOMPUTED。我应该在训练前计算均值和标准差并将这些选项用于 bbox 归一化吗？
我在cls_score和bbox_pred层修改了num_output（根据这个线程：https://github.com/rbgirshick/py-faster-rcnn/issues/1），但是在end2end解决方案中有rpn_cls_score 和 rpn_bbox_pred 层也是。我也应该修改这些的 num_output 吗？如果我应该那么我如何计算 7 类的输出数量？

不，您不需要预先计算任何东西。在 lib/roi_data_layer/roidb.py 中，如果将 BBOX_NORMALIZE_TARGETS_PRECOMPUTED 设置为 False，它会计算数据集的均值和标准差，否则，它将使用在 lib/fast_rcnn/config.py 中指定的默认值. RPN 与类的数量无关。它只将包含任何对象的区域视为正面，将其他所有内容视为负面。

Faster-RCNN bbox/image 归一化

Faster-RCNN bbox/image normalization

normalization

deep-learning

caffe

pycaffe