GCP Vertex AI 中的批量预测
batch predictions in GCP Vertex AI
在 GCP Vertex AI 中为 AutoML 模型尝试批量预测时,批量预测结果跨越多个文件(从用户角度来看这并不方便)。如果它是一个单一的批量预测结果文件,即覆盖单个文件中的所有记录,它将使过程更加简单。
例如,我的输入数据集文件中有 5585 条记录。批量预测结果包含21个文件,每个文件有200-300条记录,一共覆盖5585条记录。
对图像、文本、视频、表格 AutoML 模型进行批量预测,使用分布式处理运行作业,这意味着数据分布在任意虚拟机集群中,并以不可预测的table顺序进行处理因此,您将获得存储在 Cloud Storage 中各种文件中的预测结果。由于批量预测输出文件不是按照与输入文件相同的顺序生成的,因此提出了一个功能请求,您可以从此 link.
跟踪此请求的更新
我们目前无法提供预计到达时间,但您可以在问题跟踪器中关注进度,您可以“加星”问题以接收自动更新并通过参考此 link 给予关注。
但是,如果您正在为 tabular AutoML model 进行批量预测,您可以选择 BigQuery 作为存储,所有预测输出将存储在一个 table 中,然后您可以将 table 数据导出到单个 CSV 文件。
在 GCP Vertex AI 中为 AutoML 模型尝试批量预测时,批量预测结果跨越多个文件(从用户角度来看这并不方便)。如果它是一个单一的批量预测结果文件,即覆盖单个文件中的所有记录,它将使过程更加简单。
例如,我的输入数据集文件中有 5585 条记录。批量预测结果包含21个文件,每个文件有200-300条记录,一共覆盖5585条记录。
对图像、文本、视频、表格 AutoML 模型进行批量预测,使用分布式处理运行作业,这意味着数据分布在任意虚拟机集群中,并以不可预测的table顺序进行处理因此,您将获得存储在 Cloud Storage 中各种文件中的预测结果。由于批量预测输出文件不是按照与输入文件相同的顺序生成的,因此提出了一个功能请求,您可以从此 link.
跟踪此请求的更新我们目前无法提供预计到达时间,但您可以在问题跟踪器中关注进度,您可以“加星”问题以接收自动更新并通过参考此 link 给予关注。
但是,如果您正在为 tabular AutoML model 进行批量预测,您可以选择 BigQuery 作为存储,所有预测输出将存储在一个 table 中,然后您可以将 table 数据导出到单个 CSV 文件。