每个边界框的置信度值
Confidence value of each Bounding Box
我目前正在研究给定带有神经网络的图像的图像 class化。我已经成功地在图像上创建了边界框,并为每个边界框应用了 class 化算法(W^X+B,其中 W、B 是已经从训练数据中学习到的权重和偏差)以获得一个值每 20 classes。
对于一个边界框,我得到的值是 20 classes :
221.140961 71.6502609 185.005554 14.2860174 177.44928 -20.842535
-16.2324142 -105.940437 -397.505829 132.100311 -12.3567591 262.162872
-243.444672 -198.083984 19.3514423 1.94239163 -75.0622787 -93.7277069
-181.89653 260.002625
class 预测为 class11(class 的索引从 0 开始),其最大值为 262.162872。我也遇到过一些论文,其中我可以找到通常计算每个边界框的置信度值,其值范围从 0 到 1。
如何获取每个边界框的置信度值? 是否只是 class 11 相对于所有其他 classes 的概率?
在此数据中,我如何获取它?
要将神经网络的输出转换为概率,通常使用softmax:
https://en.wikipedia.org/wiki/Softmax_function
这确保非常小的值变为接近零的概率,非常大的值变为接近一的概率。范围的两端对 值有多大 相对不敏感,范围的中间部分敏感得多。它还确保所有概率加起来为 1。这适用于多类分类(其中 类 不相交)。
注意激活函数(比如ReLU)通常不会在softmax之前使用。所以一个典型的网络就是 convolution -> ReLU -> ... -> convolution -> ReLU -> convolution -> softmax.
P.S。您的神经网络真的像您描述的那样只有一层吗?这通常不会产生好的结果。
我目前正在研究给定带有神经网络的图像的图像 class化。我已经成功地在图像上创建了边界框,并为每个边界框应用了 class 化算法(W^X+B,其中 W、B 是已经从训练数据中学习到的权重和偏差)以获得一个值每 20 classes。
对于一个边界框,我得到的值是 20 classes :
221.140961 71.6502609 185.005554 14.2860174 177.44928 -20.842535
-16.2324142 -105.940437 -397.505829 132.100311 -12.3567591 262.162872
-243.444672 -198.083984 19.3514423 1.94239163 -75.0622787 -93.7277069
-181.89653 260.002625
class 预测为 class11(class 的索引从 0 开始),其最大值为 262.162872。我也遇到过一些论文,其中我可以找到通常计算每个边界框的置信度值,其值范围从 0 到 1。
如何获取每个边界框的置信度值? 是否只是 class 11 相对于所有其他 classes 的概率? 在此数据中,我如何获取它?
要将神经网络的输出转换为概率,通常使用softmax: https://en.wikipedia.org/wiki/Softmax_function
这确保非常小的值变为接近零的概率,非常大的值变为接近一的概率。范围的两端对 值有多大 相对不敏感,范围的中间部分敏感得多。它还确保所有概率加起来为 1。这适用于多类分类(其中 类 不相交)。
注意激活函数(比如ReLU)通常不会在softmax之前使用。所以一个典型的网络就是 convolution -> ReLU -> ... -> convolution -> ReLU -> convolution -> softmax.
P.S。您的神经网络真的像您描述的那样只有一层吗?这通常不会产生好的结果。