对新数据使用经过训练的 GB 分类器

Using trained GB classifier for new data

我训练了我的梯度提升分类器并使用 pickle 保存了模型

with open("model.bin", 'wb') as f_out:
    pickle.dump(xgb_clf, f_out)

作为数据源,我有 .csv 文件。

现在我需要测试全新数据的性能,但我现在不知道如何。

我找到了几个教程,但无法继续。

我明白了,关键是加载保存的模型

with open('model.bin', 'rb') as f_in:
    model = pickle.load(f_in)

但我不知道如何将此模型应用于 csv 中的新数据。

你能帮忙吗?

谢谢。

可以直接使用预测功能

model.predict(data)

您正在使用的 model 对象应该有一个类似于 model.predict(x) 的方法,具体取决于库(我假设它是 scikit-learn)。

您需要从 .csv 文件加载数据:

import pandas as pd
data = pd.read_csv('data.csv')  
 

Select 列属于 x:

x = data[['col1', 'col2']]

并调用预测:

res = model.predict(x)