对新数据使用经过训练的 GB 分类器
Using trained GB classifier for new data
我训练了我的梯度提升分类器并使用 pickle 保存了模型
with open("model.bin", 'wb') as f_out:
pickle.dump(xgb_clf, f_out)
作为数据源,我有 .csv 文件。
现在我需要测试全新数据的性能,但我现在不知道如何。
我找到了几个教程,但无法继续。
我明白了,关键是加载保存的模型
with open('model.bin', 'rb') as f_in:
model = pickle.load(f_in)
但我不知道如何将此模型应用于 csv 中的新数据。
你能帮忙吗?
谢谢。
可以直接使用预测功能
model.predict(data)
您正在使用的 model
对象应该有一个类似于 model.predict(x)
的方法,具体取决于库(我假设它是 scikit-learn)。
您需要从 .csv 文件加载数据:
import pandas as pd
data = pd.read_csv('data.csv')
Select 列属于 x
:
x = data[['col1', 'col2']]
并调用预测:
res = model.predict(x)
我训练了我的梯度提升分类器并使用 pickle 保存了模型
with open("model.bin", 'wb') as f_out:
pickle.dump(xgb_clf, f_out)
作为数据源,我有 .csv 文件。
现在我需要测试全新数据的性能,但我现在不知道如何。
我找到了几个教程,但无法继续。
我明白了,关键是加载保存的模型
with open('model.bin', 'rb') as f_in:
model = pickle.load(f_in)
但我不知道如何将此模型应用于 csv 中的新数据。
你能帮忙吗?
谢谢。
可以直接使用预测功能
model.predict(data)
您正在使用的 model
对象应该有一个类似于 model.predict(x)
的方法,具体取决于库(我假设它是 scikit-learn)。
您需要从 .csv 文件加载数据:
import pandas as pd
data = pd.read_csv('data.csv')
Select 列属于 x
:
x = data[['col1', 'col2']]
并调用预测:
res = model.predict(x)