Pyspark Logistic 回归模型在保存后更改精度

Pyspark Logistic Regression model changing accuracy after saving

我构建了一个 Pyspark 多项逻辑回归模型并将其与 Django 网络应用程序集成,以便我对查询集进行预测。在我的模型上,我使用推荐的

保存了它
temp_path = pjoin("/home/maffsojah/Projects/HIT_400/capstone_project/web/tbank/spark-warehouse")
reg_path = temp_path + '/reg'
reg.save(reg_path)
model2 = LogisticRegression.load(reg_path)
model2.getMaxIter()

model_path = temp_path + '/reg_model'
regModel.save(model_path)
model2 = LogisticRegressionModel.load(model_path)

当我在我的模型中测试时,一切都会正常工作,准确度是 92% 但是当我在我的 django 应用程序中保存和加载我的模型时,准确度变得非常高低且大约 22%

如何在保持相同精度水平和参数的同时保存和加载我的模型?

当你做逻辑回归时,你最终会得到一些在你保存时不会改变的权重。同样在准确性方面,不确定您是否理解机器学习的概念,但输入是数据。我认为您可能使用了不同的数据作为 django 应用程序的输入,当然您的准确度可能会很低。没有办法保持相同的准确度水平,除非你使用相同的数据集来训练你的模型,但这被称为过度拟合。