使用 scikit learn 对文本进行多标签分类
multilabel classification for text with scikit learn
我正在尝试使用 scikit-learn to texts 创建一个多标签分类器。
我是 scikit learn 的新手,我不知道是否可以为文本创建分类器。
我的意图是使用 SVM 多标签,但不知道我是否必须调整文本来训练分类器,否则您可以直接使用文本。
有人知道关于这个主题的一些文档吗?
可以参考这个例子:Classification of text documents using sparse features
它不仅可以让您了解多类信息,还可以了解基本的文本挖掘详细信息:
- 矢量化器和哈希
- 特征选择
- 处理稀疏数据
- 比较不同的基本模型
我正在尝试使用 scikit-learn to texts 创建一个多标签分类器。 我是 scikit learn 的新手,我不知道是否可以为文本创建分类器。 我的意图是使用 SVM 多标签,但不知道我是否必须调整文本来训练分类器,否则您可以直接使用文本。 有人知道关于这个主题的一些文档吗?
可以参考这个例子:Classification of text documents using sparse features
它不仅可以让您了解多类信息,还可以了解基本的文本挖掘详细信息:
- 矢量化器和哈希
- 特征选择
- 处理稀疏数据
- 比较不同的基本模型