注释规范 - AutoML (GCP)

Annotation specs - AutoML (GCP)

我在 Google Cloud Platform 上使用自然语言模块，更具体地说是使用 AUTOML 进行文本分类。当我完成数据导入并处理文本时，我遇到了这个我不明白的错误：

错误：数据集的注释规范过多，允许的最大数量为 5000。

这是什么意思？你已经拿到了吗？

谢谢

查看 AutoML Quotas & Limits 文档以更好地理解。

您似乎触及了每个数据集标签的最高限制。检查 AutoML limits --> 每个数据集的标签 --> 2 - 5000（用于分类）。

请注意，与配额不同，限制不能增加。

当我确定我的标签数量低于 5000 时，我也遇到了这个错误。事实证明这是我的 CSV 格式错误。

当您在 Pandas 中使用 to_csv() 创建文本数据时，它只会引用包含逗号的那部分文本数据，而 AutoML Text 希望您引用所有行文本。我写了解决方案