使用 scikit learn 对文本进行多标签分类

multilabel classification for text with scikit learn

我正在尝试使用 scikit-learn to texts 创建一个多标签分类器。 我是 scikit learn 的新手,我不知道是否可以为文本创建分类器。 我的意图是使用 SVM 多标签,但不知道我是否必须调整文本来训练分类器,否则您可以直接使用文本。 有人知道关于这个主题的一些文档吗?

可以参考这个例子:Classification of text documents using sparse features

它不仅可以让您了解多类信息,还可以了解基本的文本挖掘详细信息:

  • 矢量化器和哈希
  • 特征选择
  • 处理稀疏数据
  • 比较不同的基本模型