用看不见的数据测试转储分类器

Testing dump classifier with unseen data

我训练了一个分类器,然后转储它并转储它的矢量化器。现在我想通过加载分类器和向量化器来用看不见的数据测试它。有人可以帮忙吗?

查看:http://scikit-learn.org/stable/modules/model_persistence.html

首先从文件加载矢量化器:

from sklearn.externals import joblib
vectorizer = joblib.load('your_vectorizer.pkl')
clf = joblib.load('your_classifier.pkl')

然后它的工作方式与使用 pickle 将其转储到文件之前一样。即:

vectorized_data = vectorizer.transform(unseen_data)
predictions = clf.predict(vectorized_data)