训练 MITIE ner 模型的数据集

Dataset to train MITIE ner model

是否有任何现有的带有标记实体的数据集来训练 MITIE ner 模型? 我检查了 link、https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py,它只用两个样本训练模型。是否有任何带有要训练的标记实体的现有数据集?

我也一直在寻找这样的东西。仅用于 "generic"(因此不是很有用)NLU 后端。到目前为止,我唯一发现的是一个经过训练的模型,其中包含 9 个新闻类别(不是很通用)。请在此处查看博客 post:http://eric-yuan.me/ner_1/

如果您可以选择切换 NER,则 spaCy 默认提供经过训练的模型。它的可视化前端可以通过google"displacy"

找到

如果您发现任何其他信息,请告诉我!

编辑: 花了一天时间研究这个,我想我已经找到你想要的了。如果你去 https://github.com/mit-nlp/MITIE/releases 那里你会发现 MITIE 自己的 NER 模型在维基百科、Freebase 等上训练过。实际的训练数据集也在那里。他们 github 页面上的自述文件提供了有关如何使用预训练模型的示例。您还可以调查示例文件夹中的 ner.py 文件,了解如何在 python 代码中使用预训练模型。