Vertex AI 模型批量预测因内部错误而失败

Vertex AI model batch prediction failed with internal error

我已经在 Vertex AI 上训练了 AutoMl 分类模型,不幸的是,每当我尝试使用 Vertex AI 上的批量预测对训练数据集(用于成功模型训练的数据集)进行评分时,该模型不适用于批量预测 I收到以下错误:

“由于一个或多个错误,此训练作业已于 2021 年 11 月 11 日 09:42AM 取消”。

有一个选项可以从此错误中获取详细信息,并且会说以下内容:

“批量预测作业 customer_value_label_cv_automl_gui 遇到以下错误:内部”

有谁知道出现这种错误的原因是什么?我很惊讶该模型无法对它训练的数据集进行评分。我的数据集包含 570 列和大约 30 万条记录。

我们终于解决了这个问题。由于我们使用 official documentation 中描述的 model.batch_predict 方法,因此我们不必设置 machine_type 参数。最后,我们能够找出问题的根源,机器可能太弱了。一旦我们删除了这个声明,这个方法就开始使用自动资源,这就解决了这个问题。我希望 Vertex AI 错误能提供更多信息,因为我们经过大量试验和错误才弄明白。