注释规范 - AutoML (GCP)

Annotation specs - AutoML (GCP)

我在 Google Cloud Platform 上使用自然语言模块,更具体地说是使用 AUTOML 进行文本分类。 当我完成数据导入并处理文本时,我遇到了这个我不明白的错误:

错误:数据集的注释规范过多,允许的最大数量为 5000。

这是什么意思?你已经拿到了吗?

谢谢

查看 AutoML Quotas & Limits 文档以更好地理解。

您似乎触及了每个数据集标签的最高限制。检查 AutoML limits --> 每个数据集的标签 --> 2 - 5000(用于分类)。

请注意,与配额不同,限制不能增加。

当我确定我的标签数量低于 5000 时,我也遇到了这个错误。事实证明这是我的 CSV 格式错误。

当您在 Pandas 中使用 to_csv() 创建文本数据时,它只会引用包含逗号的那部分文本数据,而 AutoML Text 希望您引用所有行文本。我写了解决方案