从 spacy 模型中删除训练数据

Remove training data from spacy model

我已经训练了一个 spacy textcat 模型,但后来我意识到有一些不正确的训练数据:来自一个类别的数据恰好被标记为另一个类别。我的问题是:是否可以在不重新训练的情况下从模型中删除这些训练示例?类似于 nlp.update() 但反过来?非常感谢任何帮助!

您的意思是还原特定案例?据我所知,目前在 spaCy 中这是不可能的。

我建议要么使用更正的注释从头开始重新训练,要么使用更新的注释继续训练。如果您继续训练,请确保您继续为您的模型提供代表集,这样它就不会 "forget" 之前已经正确预测的情况。