CNN能对短文本分类多少类?
How many classes can CNN classify the short text?
我知道 CNN(conv-neural-network) 可以对 ImageNet 的 1 万多张图像进行分类。
我发现 CNN 只能将 10-20 个文本 类 分类为 this paper 写。
CNN能对短文本分类多少类? 类号的上限是多少?
分类器可以分类为好的类别的数量 precision/recall 取决于(但不限于):
- 每个类别的不同程度如何?
- 你可以从内容中获得多少特征(短文本在这里携带的信息肯定比图像少得多)——因为你使用 CNN 处理文本,我假设这些特征只是字符或单词。
- 这些功能如何区分类别?
- 你有多少高质量的标注样本? (我们没有 public 标记的短文本大型多类别数据集)
在不知道上述问题的答案的情况下,很难只给你一个数字。
我知道 CNN(conv-neural-network) 可以对 ImageNet 的 1 万多张图像进行分类。
我发现 CNN 只能将 10-20 个文本 类 分类为 this paper 写。
CNN能对短文本分类多少类? 类号的上限是多少?
分类器可以分类为好的类别的数量 precision/recall 取决于(但不限于):
- 每个类别的不同程度如何?
- 你可以从内容中获得多少特征(短文本在这里携带的信息肯定比图像少得多)——因为你使用 CNN 处理文本,我假设这些特征只是字符或单词。
- 这些功能如何区分类别?
- 你有多少高质量的标注样本? (我们没有 public 标记的短文本大型多类别数据集)
在不知道上述问题的答案的情况下,很难只给你一个数字。