生产中的 TensorFlow：如何重新训练您的模型

TensorFlow in production: How to retrain your models

我有一个与此相关的问题：

我想设置 TensorFlow Serving 以将推理作为我们其他应用程序的服务进行。我看到了 TensorFlow Serving 如何帮助我做到这一点。此外，它提到了一个 continuous training pipeline，这可能与 TensorFlow Serving 可以与多个版本的训练模型一起服务的可能性有关。但我不确定的是如何在获得新数据时重新训练模型。另一个 post 提到了运行使用 cron 作业进行再培训的想法。但是，我不确定自动再训练是否是个好主意。对于连续再训练管道，系统不断面对新的标记数据，您会建议什么架构？

编辑：这是一个监督学习案例。问题是你会在 n 个新数据点进来后自动重新训练你的模型，还是你会在客户停机期间自动重新训练或只是手动重新训练？

您可能想使用某种半监督训练。在该领域有相当广泛的研究。

一种粗略但有效的方法是使用当前最好的模型来标记新的传入数据。模型通常能够产生一个分数（希望是一个 logprob）。您可以使用该分数仅训练适合的数据。

这是我们在语音识别中使用的一种方法，是一个很好的基准。

生产中的 TensorFlow：如何重新训练您的模型

TensorFlow in production: How to retrain your models

supervised-learning

tensorflow

tensorflow-serving