重新训练和更新现有的 Rasa NLU 模型

Retraining and updating an existing Rasa NLU model

我一直在使用 Rasa NLU 进行一个涉及理解结构化文本的项目。我的用例要求我通过添加文本语料库实体的新示例来不断更新我的训练集。然而,这意味着我必须每隔几天重新训练我的模型,由于训练集大小增加,因此需要更多时间进行相同的训练。

在 Rasa NLU 中有没有一种方法可以更新已经训练好的模型,只用新的训练集数据训练它,而不是使用整个以前的训练数据集和新的训练数据集重新训练整个模型?

我正在尝试寻找一种方法,我可以通过每隔几天用增量额外训练数据集训练它来简单地更新我现有的训练模型。

迄今为止,关于该主题的最新 Github issue 表明无法重新训练仅添加新话语的模型。 与其中引用的先前问题相同。

你是对的:必须定期重新训练越来越长的文件变得越来越耗时。虽然,就地再训练在生产中不是一个好主意。

用户评论中的优秀示例:

Retraining on the same model can be a problem for production systems. I used to overwrite my models and then at some point, one of the training didn't work perfectly and I started to see a critical drop in my responses confidence. I had to find where the problem was coming from and retrain the model.

Training new model all the time (with a timestamp) is good because it makes rollbacks easier (and they will happen in production systems). I then fetch the up-to-date model names from DB.