需要一些关于 anchor box 在 yolov3 中的重要性的明确解释

Need some clear explainations about the importance of anchor box in yolov3

我正在尝试了解 YOLOv3 的算法。我在 Coursera 上观看了 Andrew Ng 关于锚框在对象检测模型中的使用的视频,尤其是在 YOLOv3 中。但是有些地方我还是不明白:
- 如果我尝试更改人脸检测模型锚框的值,则会导致非常糟糕的结果。 class预测YOLO中anchor box的重要性是什么?
- YOLOv3 仅使用 9 个锚框,默认每个尺度 3 个。因此,如果我们必须从 80 class 个中检测一个对象,并且每个 class 个具有不同的通常形状,那么这些锚框的形状是什么样的? 我是计算机视觉和机器学习的新手,所以我的问题可能很难理解。

Anchor box的目的是检测中心位于同一单元格的多个不同大小的对象。改变锚框的数量会导致 ground truth 和预测数组的长度发生变化。

假设一个框(在一个单元格中)有以下 80 个 类 [Pc,P1,P2...P80,X1,Y1,X2,Y2] 的预测,即 85 个,然后是 9 个锚框将有 85*9 = 765 个长度的数组预测。

下面是围绕 (0,0) 绘制的不同比例的锚框示例。