Google Cloud Platform - 使用自定义数据格式进行 Vertex AI 训练
Google Cloud Platform - Vertex AI training with custom data format
我需要在顶点 AI 中训练自定义 OCR。我的数据有裁剪图像文件夹,每个图像都是一行,以及一个包含 2 列的 csv 文件:图像名称和图像中的文本。
但是当我试图将它导入到顶点 AI 中的 dataset 时,我看到该图像数据集仅支持分类、分割、对象检测。所有数据集都有固定数量的标签,但我的数据有无限数量的标签(如果我们将图像中的文本视为标签),所以所有类型都不符合我的要求。我可以使用顶点 AI 进行训练吗?如何训练?
由于 Vertex AI 管理的数据集不支持 OCR 应用程序,您可以使用 Vertex AI 的训练和预测服务来训练和部署自定义模型。
我找到了一篇关于从头构建 OCR 系统的好文章 article。这个OCR系统分两步实现
- 文本检测
- 文字识别
请注意,本文不受 Google Cloud 官方支持。
在本地测试模型后,您可以使用 custom model training service. Please follow this codelab 在 Vertex AI 上训练相同的模型以获取有关训练和部署自定义模型的 step-by-step 说明。
训练完成后,可以根据您的要求使用 pre-built container offered by Vertex AI or a custom container 部署模型进行推理。您还可以选择同步请求的批量预测和异步请求的在线预测。
我需要在顶点 AI 中训练自定义 OCR。我的数据有裁剪图像文件夹,每个图像都是一行,以及一个包含 2 列的 csv 文件:图像名称和图像中的文本。 但是当我试图将它导入到顶点 AI 中的 dataset 时,我看到该图像数据集仅支持分类、分割、对象检测。所有数据集都有固定数量的标签,但我的数据有无限数量的标签(如果我们将图像中的文本视为标签),所以所有类型都不符合我的要求。我可以使用顶点 AI 进行训练吗?如何训练?
由于 Vertex AI 管理的数据集不支持 OCR 应用程序,您可以使用 Vertex AI 的训练和预测服务来训练和部署自定义模型。
我找到了一篇关于从头构建 OCR 系统的好文章 article。这个OCR系统分两步实现
- 文本检测
- 文字识别
请注意,本文不受 Google Cloud 官方支持。
在本地测试模型后,您可以使用 custom model training service. Please follow this codelab 在 Vertex AI 上训练相同的模型以获取有关训练和部署自定义模型的 step-by-step 说明。
训练完成后,可以根据您的要求使用 pre-built container offered by Vertex AI or a custom container 部署模型进行推理。您还可以选择同步请求的批量预测和异步请求的在线预测。