带有 CoNLL 2003 NER 任务描述的可能标签列表是什么?

What is the list of possible tags with a description of CoNLL 2003 NER Task?

我需要做一些 NER。我找到了 DeepPavlov 执行此操作的库。

这是来自 docs 的示例:

from deeppavlov import configs, build_model

ner_model = build_model(configs.ner.ner_ontonotes, download=True)
ner_model(['Bob Ross lived in Florida'])
>>> [[['Bob', 'Ross', 'lived', 'in', 'Florida']], [['B-PERSON', 'I-PERSON', 'O', 'O', 'B-GPE']]]

我不明白那些标签是什么意思。正如我从文档中了解到的那样,它们采用 CoNLL 2003 NER 任务格式。

有人可以指出可能的标签列表以及 CoNLL 2003 NER 任务的描述吗?

对于 NER 任务,有一些常见类型的实体用作标签:

  • 人 (PER)
  • 组织 (ORG)
  • 货币价值 (MONEY)
  • 地缘政治实体,即国家、城市、州 (GPE)

和许多其他人

此外,为了区分具有相同标签的相邻实体,许多应用程序使用 BIO 标签方案。这里 B 表示一个实体的开头, I 代表 "inside" 并且用于组成该实体的所有单词,除了第一个, 而 O 表示没有实体.

所以在上面的例子中,B-PERSON表示人名以标记Bob开头,下一个标签I-PERSON 表示 Ross 与作为前一个标签的实体相关。然后是 O 这意味着 lived 不属于任何实体,in 也是如此, 而 Florida地缘政治实体 (GPE).

的起点

如果这对您有帮助,请告诉我。