对 YOLO 过程感到困惑

Confused about YOLO Process

为了掌握这个概念，我在 YouTube 上阅读了 Mauricio Menegaz and watched a video 由 Deeplearning.ai 撰写的这篇文章，但我对 S x S x (B * 5 +C ）部分。我知道 S x S 代表网格大小，5 代表边界框的组件，C 代表 classes。 B和anchor boxes一样吗？如果我只想检测一个 class（例如车牌），那是否意味着只有 1 个 B？

编辑在将图像输入神经网络之前是否在图像上创建了边界框？

Is B the same as the anchor boxes?

是的，是的。 B 是锚框的数量

If in case I only want to detect one class (e.g. license plate), does that mean there will only be 1 B?

不，在这种情况下，C = 1。但是如果你事先知道你需要检测的对象的width/height比例，并且这个比例在视点之间变化不大，你可能只需要anchor box符合这个比例，所以在你的车牌情况下，B 也可以是 1

但是如果你需要检测汽车，你可能需要更多的anchor boxes因为width/height汽车的比例在视点之间变化很大

也许你可以看看这个实现： https://github.com/1991viet/Yolo-pytorch

对 YOLO 过程感到困惑

Confused about YOLO Process

machine-learning

computer-vision

yolo