关于训练 Watson VR 分类器时我们可以上传的最大图像总数和大小

Regarding maximum total number and size of images which we can upload when training Watson VR classifier

你能告诉我在训练 Watson VR 分类器时我们可以上传的图像的最大总数和大小吗? 我只发现每个 API 调用的最大图像数量和大小(10000 张图像,每个 zip 100MB)。

Watson Visual Recognition 文档中提供了良好训练指南和有关大小限制的详细信息:https://console.bluemix.net/docs/services/visual-recognition/customizing.html#size-limitations

此处提供了高容量分类指南:https://console.bluemix.net/docs/services/visual-recognition/customizing.html#guidelines-for-high-volume-classifying

希望对您有所帮助!

Could you tell me maximum total number and size of images which we can upload when training Watson VR classifier? I only found maximum number and size of images per API Call (10000 images, 100MB per zip).

如您所述,单个 API 调用是有限的,但是您可以使用 "retraining" 功能训练具有更多图像的分类器。基本上,您会制作适合这些每次 API 调用限制的训练数据批次,然后使用第一批训练您的分类器。然后,您将使用再训练功能(也称为 "Update a classifier" 来添加连续的批次,方法是提供 classifier_id 以将该批次添加到。更新分类器的规范在这里:https://console.bluemix.net/apidocs/visual-recognition#update-a-classifier

如果您使用大量图像进行训练,您可以选择在将训练图像发送到 Watson API 之前将其调整为正好 224x224 像素。这不会影响训练或分类的质量,但可以让您最大化每批次的图像数量。自定义训练和分类系统采取的第一步是将输入图像的大小调整为 224x224,因此如果在该分辨率下有细节不可见,学习者很可能无法辨别它们。如果您的图片非常大,或者宽高比 >2 或 <0.5,则应在提交前将它们裁剪成图块以获得最佳效果。

您可以通过重新训练添加到分类器训练集中的图像数量没有限制。但是,按照我们的定价表中的定义,每张额外的图片都算作 "training event":https://www.ibm.com/cloud/watson-visual-recognition/pricing

对于训练集中单个图像的大小也没有严格的限制,但是这很浪费并且发送大图像没有优势。不过,该服务并非 运行 魔法,因此在训练过程中可能会跳过非常大的图像或导致训练失败。该服务旨在最适合处理摄影图像。使用各种标准相机生成的 JPG 或 PNG 应该不会遇到任何问题。 (尽管 /classify 端点确实将每个图像限制为 10MB)