每个边界框的置信度值

Question

我目前正在研究给定带有神经网络的图像的图像 class化。我已经成功地在图像上创建了边界框，并为每个边界框应用了 class 化算法（W^X+B，其中 W、B 是已经从训练数据中学习到的权重和偏差）以获得一个值每 20 classes。

对于一个边界框，我得到的值是 20 classes :

 221.140961  71.6502609  185.005554 14.2860174   177.44928   -20.842535
-16.2324142 -105.940437 -397.505829 132.100311  -12.3567591  262.162872 
-243.444672 -198.083984 19.3514423  1.94239163  -75.0622787 -93.7277069 
-181.89653   260.002625

class 预测为 class11（class 的索引从 0 开始），其最大值为 262.162872。我也遇到过一些论文，其中我可以找到通常计算每个边界框的置信度值，其值范围从 0 到 1。

如何获取每个边界框的置信度值？ 是否只是 class 11 相对于所有其他 classes 的概率？在此数据中，我如何获取它？

Answer 1

要将神经网络的输出转换为概率，通常使用softmax： https://en.wikipedia.org/wiki/Softmax_function

这确保非常小的值变为接近零的概率，非常大的值变为接近一的概率。范围的两端对 值有多大 相对不敏感，范围的中间部分敏感得多。它还确保所有概率加起来为 1。这适用于多类分类（其中类不相交）。

注意激活函数（比如ReLU）通常不会在softmax之前使用。所以一个典型的网络就是 convolution -> ReLU -> ... -> convolution -> ReLU -> convolution -> softmax.

P.S。您的神经网络真的像您描述的那样只有一层吗？这通常不会产生好的结果。

每个边界框的置信度值

Confidence value of each Bounding Box

machine-learning

svm

bounding-box

neural-network

conv-neural-network