CNN能对短文本分类多少类?

How many classes can CNN classify the short text?

我知道 CNN(conv-neural-network) 可以对 ImageNet 的 1 万多张图像进行分类。

我发现 CNN 只能将 10-20 个文本 类 分类为 this paper 写。

CNN能对短文本分类多少类? 类号的上限是多少?

分类器可以分类为好的类别的数量 precision/recall 取决于(但不限于):

  • 每个类别的不同程度如何?
  • 你可以从内容中获得多少特征(短文本在这里携带的信息肯定比图像少得多)——因为你使用 CNN 处理文本,我假设这些特征只是字符或单词。
  • 这些功能如何区分类别?
  • 你有多少高质量的标注样本? (我们没有 public 标记的短文本大型多类别数据集)

在不知道上述问题的答案的情况下,很难只给你一个数字。