对 Yolo 感到困惑

Confused about Yolo

我对 Yolo 的工作原理有点困惑。 在论文中,他们说:

"置信度预测表示 预测框和任何地面真值框。"

但是我们如何获得ground truth box呢?假设我在未标记的图像上使用我的 Yolo 网络(已经训练)。那我有什么信心?

抱歉,如果问题很简单,但我真的不明白这部分... 谢谢!

YOLO 使用 IOU 来衡量权重 training.When 你搜索过什么是 IOU 是这样的

所以在训练这个 IoU 分数时计算验证时的预测 data.It 意味着

(Prediction of object)*IoU score

希望对您有所帮助。

But how do we have the ground truth box?

您似乎对训练数据到底是什么以及 YOLO 的输出或预测是什么感到困惑。

训练数据是一个边界框和 class 标签。这称为 'ground truth box'、b = [bx, by, bh, bw, class_name (or number)],其中 bx, by 是带注释的边界框的中点,bh, bw 是框的高度和宽度。

输出或预测是边界框 b 以及图像 i 的 class c。 形式上:y = [ pl, bx, by, bh, bw, cn ] 其中 bx, by 是带注释的边界框的中点。 bh, bw 是盒子的高度和宽度,pc - 在 'box' b 中有 class(es) c 的概率。

Let's say I use my Yolo network (already trained) on an image that is not labelled. What is my confidence then?

当你说你有一个预训练模型(你指的是已经训练过)时,你的网络已经 'knows' 特定对象的边界框 classes 并且它试图近似对象可能在新图像中,但在这样做时,您的网络可能会在其他地方预测边界框而不是它应该在的地方。那么如何计算盒子'somewhere else'是多少呢?欠条来拯救! IOU (Intersection Over Union) 的作用是,它让你得到一个重叠面积超过并集面积的分数。

IOU = Area of Overlap / Area of Union

虽然它很少是完美的或 1。它有点接近,IOU 的值越小,YOLO 参考 ground truth 预测边界框就越差。 IOU 分数为 1 表示边界框是准确或非常自信地参考地面实况预测的。

我认为你所需要的只是一张能阐明什么是基本事实的好图片。

正如您在左侧看到的那样,完美包围对象的矩形是地面实况(蓝色的)。

橙色矩形是预测的矩形。 IoU 是您可以从图像的右侧直观地理解的内容。

希望对您有所帮助。

我想我知道答案了 猜测 YOLO 在 2 种情况下针对不同的目标使用 IoU 1- 在训练时评估预测 2-当你使用已经训练好的模型时,有时你会为同一个对象得到很多框。我有红色这就是 YOLO 解决这个问题的方式(不确定这是否是非最大抑制的一部分)