文本分类测试 NLTK python
Text Categorization Test NLTK python
我使用 nltk 包并使用朴素贝叶斯训练模型。我已使用 pickle 包将模型保存到文件中。现在我想知道如何使用这个模型像不在数据集中的随机文本一样进行测试,并且该模型会判断句子是否属于哪个分类?
就像我的想法一样,我有一句话:“罗纳尔多在对阵埃及的比赛中进了 2 个球”并将其传递给模型文件并 return 分类 "sport"。
仅仅保存模型是没有用的。您还应该保存您的 VectorModel(例如 tfidfvectorizer 或 countvectorizer 用于拟合火车数据的任何东西)。您可以使用泡菜以相同的方式保存它们。同时保存您用于 pre-processing 训练数据的所有模型,例如 normalization/scaling 模型等。对于测试数据,通过加载您保存的 pickle 模型重复相同的步骤并将测试数据转换为训练数据您用于模型构建的格式,然后您将能够进行分类。
我使用 nltk 包并使用朴素贝叶斯训练模型。我已使用 pickle 包将模型保存到文件中。现在我想知道如何使用这个模型像不在数据集中的随机文本一样进行测试,并且该模型会判断句子是否属于哪个分类?
就像我的想法一样,我有一句话:“罗纳尔多在对阵埃及的比赛中进了 2 个球”并将其传递给模型文件并 return 分类 "sport"。
仅仅保存模型是没有用的。您还应该保存您的 VectorModel(例如 tfidfvectorizer 或 countvectorizer 用于拟合火车数据的任何东西)。您可以使用泡菜以相同的方式保存它们。同时保存您用于 pre-processing 训练数据的所有模型,例如 normalization/scaling 模型等。对于测试数据,通过加载您保存的 pickle 模型重复相同的步骤并将测试数据转换为训练数据您用于模型构建的格式,然后您将能够进行分类。