了解 Spacy 的 Scorer 输出

Understanding Spacy's Scorer Output

我正在评估我使用 Spacy 构建的自定义 NER 模型。我正在使用 Spacy 的 Scorer class.

评估训练集
    def Eval(examples):
    # test the saved model
    print("Loading from", './model6/')
    ner_model = spacy.load('./model6/')

    scorer = Scorer()
    try:
        for input_, annot in examples:
            doc_gold_text = ner_model.make_doc(input_)
            gold = GoldParse(doc_gold_text, entities=annot['entities'])
            pred_value = ner_model(input_)
            scorer.score(pred_value, gold)
    except Exception as e: print(e)

    print(scorer.scores)

它工作正常,但我不明白输出。这是我从每个训练集得到的结果。

{'uas': 0.0, 'las': 0.0, 'ents_p': 90.14084507042254, 'ents_r': 92.7536231884058, 'ents_f': 91.42857142857143, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 91.12227805695142, 'ents_r': 93.47079037800687, 'ents_f': 92.28159457167091, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 92.45614035087719, 'ents_r': 92.9453262786596, 'ents_f': 92.70008795074759, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 94.5993031358885, 'ents_r': 94.93006993006993, 'ents_f': 94.76439790575917, 'tags_acc': 0.0, 'token_acc': 100.0}

{'uas': 0.0, 'las': 0.0, 'ents_p': 92.07920792079209, 'ents_r': 93.15525876460768, 'ents_f': 92.61410788381743, 'tags_acc': 0.0, 'token_acc': 100.0}

有人知道钥匙是什么吗?我查看了 Spacy 的文档,但找不到任何内容。

谢谢!

  • UAS(未标记附件分数)和 LAS(标记附件分数)是评估依赖项解析的标准指标。 UAS 是头部被正确分配的 token 的比例,LAS 是头部被正确分配了正确的依赖标签(主题、对象等)的 token 的比例。
  • ents_pents_rents_f 是 NER 任务的精度、召回率和 fscore
  • tags_acc 是词性标注准确率。
  • token_acc好像是token分割的精度