如何获取每个 Spacy NER 实体的描述?

How to get a description for each Spacy NER entity?

我正在使用 Spacy NER model 从文本中提取一些与我的问题相关的命名实体,例如 DATE、TIME、GPE 等。

例如,我需要识别以下句子中的时区:

"Australian Central Time"

使用 Spacy 模型 en_core_web_lg,我得到以下结果:

doc = nlp("Australian Central Time")
print([(ent.label_, ent.text) for ent in doc.ents])
    
>> [('NORP', 'Australian')]

我的问题是:我不清楚实体的确切含义 NORP 更一般地说,每个 Spacy NER 实体的确切含义(撇开当然是直觉值)。

我找到了以下代码片段来获取完整的实体列表,但之后我就被屏蔽了:

import spacy
nlp = spacy.load("en_core_web_lg")
nlp.get_pipe("ner").labels

我对使用 Spacy NLP 还很陌生,在官方文档中没有找到我要找的东西,所以任何帮助都将不胜感激!

顺便说一句,我使用的是 Spacy 版本 3.2.1

大多数标签都有您可以使用 spacy.explain(label) 访问的定义。

对于NORP:“国籍或宗教或政治团体”

有关更多详细信息,您需要查看 https://spacy.io/models/ 下模型文档中列出的资源的注释指南。