YOLO 的输出是如何编码的

How is output encoded for YOLO

如果一个网格中的多个方框有相同的对象假设是汽车,那么对于所有方框来说,有车的是 bx, bybhbw是一样的吗?这里 bx, by 是汽车的中心像素, bh, bw 是边界框的高度和宽度。

我也有同样的困惑。让我给你直觉,它是如何处理这个问题的。

在yolo中,我们有三个重要参数IOUclass-confidence-score box-confidence-score,它决定了哪个网格在各个方面都有更大的概率,并修剪其他概率较低的网格。

因此,即使有许多具有相同边界框尺寸的网格,但网格单元中对象的概率是不同的,这改变了网格的框置信度得分,计算为pr(object).IOU。这样,yolo 删除了那些网格。

这里是link,里面有yolo的滞留解释