scikit-learn "Working with Text Data Tutorial" 忽略了我的目标类别
scikit-learn "Working with Text Data Tutorial" ignores my target categories
我正在研究 ML 算法并查看:Scikit-Learn Working with Text Tutorial
现在我尝试使用我自己的训练数据集,其中包含 1 个特征 = 消息,以及从 -2(负面)到 2(正面)的 5 个类别评分。
然后我按照教程中的说明进行操作,但它总是 return 最多 4 target_categories 而不是 5!
target_categories = ['-2', '-1', '0', '1','2']
print(metrics.classification_report(train_data.Category, predicted,target_names=target_categories))
我只会得到 -2,-1,0,1 的 predicted_proba
。例如:[0.2 0.2 0.4 0.4]
为什么 Scikit 只给我一个 4x1 向量而不是 5x1?为什么我的 target_categories
中的最后一个值被省略了?
如果我只使用 3,我会得到一个错误:
values = [target_names[i]]
IndexError: list index out of range
非常感谢您的帮助!
是的,它不起作用的原因是,因为我将训练数据拆分为 50%,而 target_values
并未全部包含在训练数据中。下次我去洗牌。
我正在研究 ML 算法并查看:Scikit-Learn Working with Text Tutorial
现在我尝试使用我自己的训练数据集,其中包含 1 个特征 = 消息,以及从 -2(负面)到 2(正面)的 5 个类别评分。
然后我按照教程中的说明进行操作,但它总是 return 最多 4 target_categories 而不是 5!
target_categories = ['-2', '-1', '0', '1','2']
print(metrics.classification_report(train_data.Category, predicted,target_names=target_categories))
我只会得到 -2,-1,0,1 的 predicted_proba
。例如:[0.2 0.2 0.4 0.4]
为什么 Scikit 只给我一个 4x1 向量而不是 5x1?为什么我的 target_categories
中的最后一个值被省略了?
如果我只使用 3,我会得到一个错误:
values = [target_names[i]]
IndexError: list index out of range
非常感谢您的帮助!
是的,它不起作用的原因是,因为我将训练数据拆分为 50%,而 target_values
并未全部包含在训练数据中。下次我去洗牌。