了解 Spacy 的 Scorer 输出
Understanding Spacy's Scorer Output
我正在评估我使用 Spacy 构建的自定义 NER 模型。我正在使用 Spacy 的 Scorer class.
评估训练集
def Eval(examples):
# test the saved model
print("Loading from", './model6/')
ner_model = spacy.load('./model6/')
scorer = Scorer()
try:
for input_, annot in examples:
doc_gold_text = ner_model.make_doc(input_)
gold = GoldParse(doc_gold_text, entities=annot['entities'])
pred_value = ner_model(input_)
scorer.score(pred_value, gold)
except Exception as e: print(e)
print(scorer.scores)
它工作正常,但我不明白输出。这是我从每个训练集得到的结果。
{'uas': 0.0, 'las': 0.0, 'ents_p': 90.14084507042254, 'ents_r': 92.7536231884058, 'ents_f': 91.42857142857143, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 91.12227805695142, 'ents_r': 93.47079037800687, 'ents_f': 92.28159457167091, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 92.45614035087719, 'ents_r': 92.9453262786596, 'ents_f': 92.70008795074759, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 94.5993031358885, 'ents_r': 94.93006993006993, 'ents_f': 94.76439790575917, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 92.07920792079209, 'ents_r': 93.15525876460768, 'ents_f': 92.61410788381743, 'tags_acc': 0.0, 'token_acc': 100.0}
有人知道钥匙是什么吗?我查看了 Spacy 的文档,但找不到任何内容。
谢谢!
- UAS(未标记附件分数)和 LAS(标记附件分数)是评估依赖项解析的标准指标。 UAS 是头部被正确分配的 token 的比例,LAS 是头部被正确分配了正确的依赖标签(主题、对象等)的 token 的比例。
ents_p
、ents_r
、ents_f
是 NER 任务的精度、召回率和 fscore。
tags_acc
是词性标注准确率。
token_acc
好像是token分割的精度
我正在评估我使用 Spacy 构建的自定义 NER 模型。我正在使用 Spacy 的 Scorer class.
评估训练集 def Eval(examples):
# test the saved model
print("Loading from", './model6/')
ner_model = spacy.load('./model6/')
scorer = Scorer()
try:
for input_, annot in examples:
doc_gold_text = ner_model.make_doc(input_)
gold = GoldParse(doc_gold_text, entities=annot['entities'])
pred_value = ner_model(input_)
scorer.score(pred_value, gold)
except Exception as e: print(e)
print(scorer.scores)
它工作正常,但我不明白输出。这是我从每个训练集得到的结果。
{'uas': 0.0, 'las': 0.0, 'ents_p': 90.14084507042254, 'ents_r': 92.7536231884058, 'ents_f': 91.42857142857143, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 91.12227805695142, 'ents_r': 93.47079037800687, 'ents_f': 92.28159457167091, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 92.45614035087719, 'ents_r': 92.9453262786596, 'ents_f': 92.70008795074759, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 94.5993031358885, 'ents_r': 94.93006993006993, 'ents_f': 94.76439790575917, 'tags_acc': 0.0, 'token_acc': 100.0}
{'uas': 0.0, 'las': 0.0, 'ents_p': 92.07920792079209, 'ents_r': 93.15525876460768, 'ents_f': 92.61410788381743, 'tags_acc': 0.0, 'token_acc': 100.0}
有人知道钥匙是什么吗?我查看了 Spacy 的文档,但找不到任何内容。
谢谢!
- UAS(未标记附件分数)和 LAS(标记附件分数)是评估依赖项解析的标准指标。 UAS 是头部被正确分配的 token 的比例,LAS 是头部被正确分配了正确的依赖标签(主题、对象等)的 token 的比例。
ents_p
、ents_r
、ents_f
是 NER 任务的精度、召回率和 fscore。tags_acc
是词性标注准确率。token_acc
好像是token分割的精度