是否可以将自定义实体标签添加到 Spacy 3.0 配置文件?

Is it possible to add custom entity labels to Spacy 3.0 config file?

我正在使用 spacy-transformers 和 roBERTa 开发自定义 NER 模型。我实际上只是为此使用了 CLI,并且正在尝试更改我的 Spacy config.cfg 文件以说明管道中的自定义实体标签。

我是 Spacy 的新手,但我了解到人们通常使用 ner.add_label 来完成此操作。我想知道我是否可以更改配置的 [initialize.components.ner.labels] 中的某些内容,但还没有找到好的方法。

我似乎找不到任何选项来以类似的方式更改配置文件 - 有谁知道这是否可行,或者实现这些自定义标签的最简洁方法是什么?

为清楚起见进行了编辑:我的问题可能与我的配置理论不同。现在我得到一个输出,但不是文本标签,而是数字标签,例如:

('Oct',383) ('2019',383) ('February',383)

提前感谢您的帮助!

如果您正在使用基于配置的训练,通常您不必在任何地方指定标签 - spaCy 将查看训练数据并从那里获取标签列表。

在少数情况下这不起作用。

你有一些标签不在你的训练数据中。这些无法学习,所以我认为这是一个错误,但有时你必须使用您获得的数据。

您的训练数据非常大。 在这种情况下,读取所有训练数据以获得完整的标签列表可能是个问题。您可以使用init labels命令生成数据,这样就不必每次开始训练时都扫描输入数据。