生产中的 TensorFlow:如何重新训练您的模型

TensorFlow in production: How to retrain your models

我有一个与此相关的问题:

我想设置 TensorFlow Serving 以将推理作为我们其他应用程序的服务进行。我看到了 TensorFlow Serving 如何帮助我做到这一点。此外,它提到了一个 continuous training pipeline,这可能与 TensorFlow Serving 可以与多个版本的训练模型一起服务的可能性有关。但我不确定的是如何在获得新数据时重新训练模型。另一个 post 提到了 运行 使用 cron 作业进行再培训的想法。但是,我不确定自动再训练是否是个好主意。对于连续再训练管道,系统不断面对新的标记数据,您会建议什么架构?

编辑:这是一个监督学习案例。问题是你会在 n 个新数据点进来后自动重新训练你的模型,还是你会在客户停机期间自动重新训练或只是手动重新训练?

您可能想使用某种半监督训练。在该领域有相当广泛的研究。

一种粗略但有效的方法是使用当前最好的模型来标记新的传入数据。模型通常能够产生一个分数(希望是一个 logprob)。您可以使用该分数仅训练适合的数据。

这是我们在语音识别中使用的一种方法,是一个很好的基准。