神经网络输出中的边界框估计
Bounding box estimation in neural network output
我正在研究卷积神经网络来识别动物、车辆、树木等物体。class 用于检测的对象之一是汽车。当我将图像提供给网络时,它预测为 auto 。但我需要在对象周围绘制一个边界框。当我尝试滑动 window 方式时,我得到了很多边界框,但我只需要一个。神经网络预测后如何找出最合适的物体边界框??我们不需要一些方法来从大图像中定位对象吗?这就是我想要的。
我的最后一层函数是逻辑回归函数,它只预测 1 或 0。我不知道如何根据概率得分进行预测。如果我有每个盒子的概率分数,那么找出最合适的盒子就很容易了。请建议我一些找到相同方法的方法。提前致谢。欢迎大家回答。
不清楚输入图像中是单个对象还是多个对象。你的例子显示了一个。
如果您有 ONE 个对象,这里有一些要考虑的边界框选项:
- Keep most distant ones: 保留距离所有边界框中心最远的上、下、右、左边界。
- 保持平均值:例如获取所有顶部边界并保持其平均位置。对所有底部、右侧和左侧边界重复相同的操作。
- 保留中位数:与平均值相同,但保留每个方向边界的中位数。
- 保留具有最大激活的边界框:您使用逻辑回归作为最后一步,找到进入该逻辑层的输入,并保留对逻辑层的输入最大。
我正在研究卷积神经网络来识别动物、车辆、树木等物体。class 用于检测的对象之一是汽车。当我将图像提供给网络时,它预测为 auto 。但我需要在对象周围绘制一个边界框。当我尝试滑动 window 方式时,我得到了很多边界框,但我只需要一个。神经网络预测后如何找出最合适的物体边界框??我们不需要一些方法来从大图像中定位对象吗?这就是我想要的。
我的最后一层函数是逻辑回归函数,它只预测 1 或 0。我不知道如何根据概率得分进行预测。如果我有每个盒子的概率分数,那么找出最合适的盒子就很容易了。请建议我一些找到相同方法的方法。提前致谢。欢迎大家回答。
不清楚输入图像中是单个对象还是多个对象。你的例子显示了一个。
如果您有 ONE 个对象,这里有一些要考虑的边界框选项:
- Keep most distant ones: 保留距离所有边界框中心最远的上、下、右、左边界。
- 保持平均值:例如获取所有顶部边界并保持其平均位置。对所有底部、右侧和左侧边界重复相同的操作。
- 保留中位数:与平均值相同,但保留每个方向边界的中位数。
- 保留具有最大激活的边界框:您使用逻辑回归作为最后一步,找到进入该逻辑层的输入,并保留对逻辑层的输入最大。