Mechanical Turk 边界框数据是如何批量格式化的?

How is Mechanical Turk Bounding Box Data Formatted in Bulk?

我正在尝试使用 YOLOv3 使用从 MTurk 获得的数据训练分类器。我使用 Sandbox 查看来自 1 个 HIT 的数据是如何格式化的。我编写代码来解析 Amazon Mechanical Turk 提​​供的 JSON 字符串没有问题,但我想在支付服务费用之前先了解一下。所以我知道如何格式化项目和我需要添加的任何其他变量。

我可以看到 1 个任务的格式,但我想做 50 或 60 个任务,看看 MTurk 如何呈现数据。如果有人有多个 HIT 的例子,我将不胜感激。

它在 CSV 文件中给出,您的注释在 JSON 字符串和图像宽度和高度中。每个图像与其行相关联。

这里是 example file 删除了几列。

需要注意的一件事是,在 Mturk 中似乎没有办法在批准前查看注释。可能需要做一点 python 魔术,以便更容易看到注释的质量。