'en' 模型的 NER 类型?

NER types for 'en' model?

有没有办法在 spaCy 中获取所有内置和添加的自定义 NER 类型? here 建议的方法似乎不再有效。在尝试

nlp.entity.cfg 

我回来了,

{u'hist_size': 0, u'pretrained_dims': 0L, u'hist_width': 0, u'beam_density': 
0.0, u'cnn_maxout_pieces': 3, u'maxout_pieces': 2, u'hidden_depth': 1, 
u'token_vector_width': 128, u'nr_class': 73, u'beam_width': 1, 
u'hidden_width': 200}

此词典中没有 'actions' 和 'extra_labels' 键。

不太确定这样做是否合适。我想通了

nlp.entity.move_names

returns,

[u'B-PERSON', u'B-CARDINAL', u'B-ORG', u'B-GPE', u'B-FAC', u'B-MONEY', u'B-NORP', u'B-DATE', u'B-TIME', u'B-ORDINAL', u'B-PERCENT', u'B-PRODUCT', u'B-LANGUAGE', u'B-LOC', u'B-QUANTITY', u'B-WORK_OF_ART', u'B-EVENT', u'B-LAW', u'I-PERSON', u'I-CARDINAL', u'I-ORG', u'I-GPE', u'I-FAC', u'I-MONEY', u'I-NORP', u'I-DATE', u'I-TIME', u'I-ORDINAL', u'I-PERCENT', u'I-PRODUCT', u'I-LANGUAGE', u'I-LOC', u'I-QUANTITY', u'I-WORK_OF_ART', u'I-EVENT', u'I-LAW', u'L-PERSON', u'L-CARDINAL', u'L-ORG', u'L-GPE', u'L-FAC', u'L-MONEY', u'L-NORP', u'L-DATE', u'L-TIME', u'L-ORDINAL', u'L-PERCENT', u'L-PRODUCT', u'L-LANGUAGE', u'L-LOC', u'L-QUANTITY', u'L-WORK_OF_ART', u'L-EVENT', u'L-LAW', u'U-PERSON', u'U-CARDINAL', u'U-ORG', u'U-GPE', u'U-FAC', u'U-MONEY', u'U-NORP', u'U-DATE', u'U-TIME', u'U-ORDINAL', u'U-PERCENT', u'U-PRODUCT', u'U-LANGUAGE', u'U-LOC', u'U-QUANTITY', u'U-WORK_OF_ART', u'U-EVENT', u'U-LAW', u'O']

这还显示了添加到模型中的任何其他自定义实体,例如我的 u'EMAIL':

[u'B-PERSON', u'B-CARDINAL', u'B-ORG', u'B-GPE', u'B-FAC', u'B-MONEY', u'B-NORP', u'B-DATE', u'B-TIME', u'B-ORDINAL', u'B-PERCENT', u'B-PRODUCT', u'B-LANGUAGE', u'B-LOC', u'B-QUANTITY', u'B-WORK_OF_ART', u'B-EVENT', u'B-LAW', u'I-PERSON', u'I-CARDINAL', u'I-ORG', u'I-GPE', u'I-FAC', u'I-MONEY', u'I-NORP', u'I-DATE', u'I-TIME', u'I-ORDINAL', u'I-PERCENT', u'I-PRODUCT', u'I-LANGUAGE', u'I-LOC', u'I-QUANTITY', u'I-WORK_OF_ART', u'I-EVENT', u'I-LAW', u'L-PERSON', u'L-CARDINAL', u'L-ORG', u'L-GPE', u'L-FAC', u'L-MONEY', u'L-NORP', u'L-DATE', u'L-TIME', u'L-ORDINAL', u'L-PERCENT', u'L-PRODUCT', u'L-LANGUAGE', u'L-LOC', u'L-QUANTITY', u'L-WORK_OF_ART', u'L-EVENT', u'L-LAW', u'U-PERSON', u'U-CARDINAL', u'U-ORG', u'U-GPE', u'U-FAC', u'U-MONEY', u'U-NORP', u'U-DATE', u'U-TIME', u'U-ORDINAL', u'U-PERCENT', u'U-PRODUCT', u'U-LANGUAGE', u'U-LOC', u'U-QUANTITY', u'U-WORK_OF_ART', u'U-EVENT', u'U-LAW', u'O', u'B-EMAIL', u'I-EMAIL', u'L-EMAIL', u'U-EMAIL'] 

我找到了另一种方法。适用于 spacy v. 3.0.5:

ner = nlp.get_pipe('ner')
print(ner.labels)

它给出了结果:

('CARDINAL', 'DATE', 'EVENT', 'FAC', 'GPE', 'LANGUAGE', 'LAW', 'LOC', 'MONEY', 'NORP', 'ORDINAL', 'ORG', 'PERCENT', 'PERSON', 'PRODUCT', 'QUANTITY', 'TIME', 'WORK_OF_ART')