我是否需要提供用于训练 Spacy NER 的句子或段落是否合适?
Do I need to provide sentences for training Spacy NER or are paragraphs fine?
我正在尝试训练一个新的 Spacy 模型来识别对法律文章的引用。我开始使用空白模型,并根据文档中给出的示例训练ner pipe。
训练出来的模型性能真的很差,输入点也有几千个。我正在尝试找出原因。
一个可能的答案是我给出了完整的段落来训练,而不是示例中的句子。这些段落中的每一个都可以多次引用法律文章。这可能是个问题吗?
原来我在代码中犯了一个大错误。段落没有错。只要您的代码实际将它们提供给 spacy.
段落应该没问题。你能举个输入数据点的例子吗?
我正在尝试训练一个新的 Spacy 模型来识别对法律文章的引用。我开始使用空白模型,并根据文档中给出的示例训练ner pipe。
训练出来的模型性能真的很差,输入点也有几千个。我正在尝试找出原因。
一个可能的答案是我给出了完整的段落来训练,而不是示例中的句子。这些段落中的每一个都可以多次引用法律文章。这可能是个问题吗?
原来我在代码中犯了一个大错误。段落没有错。只要您的代码实际将它们提供给 spacy.
段落应该没问题。你能举个输入数据点的例子吗?