将分类转移到生产环境

moving classification to production environment

我正在设计分析系统的架构。我有一个在 scikit learn 中开发的分类集成模型。我想将它移到生产环境中,以便可以使用该模型对新传入的数据进行动态分类。理想情况下,系统应支持手动将 "model" 上传到生产系统。我对分析生产系统没有任何经验。任何建议都会很有帮助

我查看了Py2PMML,但并不支持所有模型。 我主要是在寻找增强树回归。 PS:我不是要代码或示例。方向刚刚好

目前文档中没有 official way to export scikit models to PMML. The recommended way is to use pickle or joblib.dump. Please refer to the model persistence 部分。这个想法是将模型保存到磁盘:

>>> from sklearn.externals import joblib
>>> joblib.dump(model, 'saved_model.pkl') 

然后将其上传到您的生产服务器并加载:

>>> model = joblib.load('saved_model.pkl')

尝试拥有相似的环境很重要,保存在一个版本的 scikit-learn 中的模型可能无法在另一个版本中加载。