YOLOv4 注释将维度保存在 [0,1] 浮点数中

YOLOv4 annotations saves dimensions in a [0,1] float

这是来自图像的注释文件:

0 0.6142131979695431 0.336 0.467005076142132 0.392

第一个零是 class 标签。 0.61421319796954310.336 是边界框的 xy 坐标。 0.4670050761421320.392 是边界框的宽度和高度。但是,我不明白为什么 x、y、宽度和高度在 [0,1] 浮点数中。有人告诉我,它是百分比,但是相对于什么的百分比?

例如。我正在编写构建合成数据集的软件。这是我制作的一张训练图像。它在我要检测的对象周围有边界框。

边界框完美地包裹了 Wizards 和 Ubuntu 标志。那么如何像上面的格式一样注释它们呢?

yolo 格式中的 width/height 是(整个图像)总数 width/height 的分数。所以左上角总是(0,0),右下角总是(1,1),无论图像大小如何。

查看此 将边界框 (x1, y1, x2, y2) 转换为 YOLO 样式 (X, Y, W, H)