使用不同语言的数据集从 DeepPavlov 重新训练多语言 NER 模型(ner_ontonotes_bert_mult)

Retrain the multi language NER model(ner_ontonotes_bert_mult) from DeepPavlov with a dataset in a different language

我已经成功安装了 DeepPavlov(ner_ontonotes_bert_mult) 的多语言 NER 模型。我想用阿尔巴尼亚语 language.Is 中的新数据(与他们在 documentation 页面中建议的格式相同)重新训练这个模型这可能(重新训练来自 DeepPavlov 的多语言 NER 模型不同语言的数据),或者仅当我们有英文数据时重新训练才有效??

是的,您可以在用于多语言 BERT 训练的任何语言上微调模型 https://github.com/google-research/bert/blob/master/multilingual.md#list-of-languages

如果多语言词汇能够很好地覆盖您的语言,也可以对不在上面列表中的语言进行微调。