对 YOLO 过程感到困惑
Confused about YOLO Process
为了掌握这个概念,我在 YouTube 上阅读了 Mauricio Menegaz and watched a video 由 Deeplearning.ai 撰写的这篇文章,但我对 S x S x (B * 5 +C ) 部分。我知道 S x S 代表网格大小,5 代表边界框的组件,C 代表 classes。 B和anchor boxes一样吗?如果我只想检测一个 class(例如车牌),那是否意味着只有 1 个 B?
编辑
在将图像输入神经网络之前是否在图像上创建了边界框?
Is B the same as the anchor boxes?
是的,是的。 B 是锚框的数量
If in case I only want to detect one class (e.g. license plate), does that mean there will only be 1 B?
不,在这种情况下,C = 1。但是如果你事先知道你需要检测的对象的width/height比例,并且这个比例在视点之间变化不大,你可能只需要anchor box符合这个比例,所以在你的车牌情况下,B 也可以是 1
但是如果你需要检测汽车,你可能需要更多的anchor boxes因为width/height汽车的比例在视点之间变化很大
也许你可以看看这个实现:
https://github.com/1991viet/Yolo-pytorch
为了掌握这个概念,我在 YouTube 上阅读了 Mauricio Menegaz and watched a video 由 Deeplearning.ai 撰写的这篇文章,但我对 S x S x (B * 5 +C ) 部分。我知道 S x S 代表网格大小,5 代表边界框的组件,C 代表 classes。 B和anchor boxes一样吗?如果我只想检测一个 class(例如车牌),那是否意味着只有 1 个 B?
编辑 在将图像输入神经网络之前是否在图像上创建了边界框?
Is B the same as the anchor boxes?
是的,是的。 B 是锚框的数量
If in case I only want to detect one class (e.g. license plate), does that mean there will only be 1 B?
不,在这种情况下,C = 1。但是如果你事先知道你需要检测的对象的width/height比例,并且这个比例在视点之间变化不大,你可能只需要anchor box符合这个比例,所以在你的车牌情况下,B 也可以是 1
但是如果你需要检测汽车,你可能需要更多的anchor boxes因为width/height汽车的比例在视点之间变化很大
也许你可以看看这个实现: https://github.com/1991viet/Yolo-pytorch