Google Cloud Platform - 使用自定义数据格式进行 Vertex AI 训练

Google Cloud Platform - Vertex AI training with custom data format

我需要在顶点 AI 中训练自定义 OCR。我的数据有裁剪图像文件夹,每个图像都是一行,以及一个包含 2 列的 csv 文件:图像名称和图像中的文本。 但是当我试图将它导入到顶点 AI 中的 dataset 时,我看到该图像数据集仅支持分类、分割、对象检测。所有数据集都有固定数量的标签,但我的数据有无限数量的标签(如果我们将图像中的文本视为标签),所以所有类型都不符合我的要求。我可以使用顶点 AI 进行训练吗?如何训练?

由于 Vertex AI 管理的数据集不支持 OCR 应用程序,您可以使用 Vertex AI 的训练和预测服务来训练和部署自定义模型。

我找到了一篇关于从头构建 OCR 系统的好文章 article。这个OCR系统分两步实现

  1. 文本检测
  2. 文字识别

请注意,本文不受 Google Cloud 官方支持。

在本地测试模型后,您可以使用 custom model training service. Please follow this codelab 在 Vertex AI 上训练相同的模型以获取有关训练和部署自定义模型的 step-by-step 说明。

训练完成后,可以根据您的要求使用 pre-built container offered by Vertex AI or a custom container 部署模型进行推理。您还可以选择同步请求的批量预测和异步请求的在线预测。